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Kurzfassung 


Die Digitalisierung hat bereits viele Bereiche der Wirtschaft und des gesell- 
schaftlichen Lebens verändert. Auch unterliegen die Aspekte des Gesund- 
heitswesens und der klinischen Praxis einem digitalen Wandel. Dabei steigt 
gleichzeitig der Bedarf an weltweit akzeptierbaren Lösungen zum Austausch 
und zur Auswertung medizinischer Daten. In diesem Zuge gewinnen die Fast 
Healthcare Interoperability Resources (FHIR) zunehmend an Bedeutung - in 
Deutschland werden sie beispielsweise in Zusammenhang mit der Elektroni- 
schen Patientenakte (ePA) eingesetzt. 


Im Hinblick auf diese Entwicklungen, wird FHIR in der vorliegenden Disser- 
tation zur Wissensrepräsentation genutzt. Dabei wird in einem ersten Bei- 
trag die probabilistische Erweiterung eines FHIR DataRequirements vollzo- 
gen. Die Erweiterung erlaubt es, Observationswahrscheinlichkeiten zu hin- 
terlegen und so ein Lücke bei der bisherigen Prozessmodellierung in FHIR zu 
schließen. 


Darüber hinaus wird in dieser Arbeit eine strukturierte Vorgehensweise zur 
Wissensakquisition und -formalisierung von medizinischen Prozessen im Be- 
reich der Diagnostik sowie der Therapie vorgestellt. Das Konzept beschreibt 
ein Expertensystem, bei welchem FHIR als Wissensbasis eingesetzt wird. Für 
den Wissenserwerb dienen Ablaufmodelle, die für alle Seiten, sprich: sowohl 
für den medizinischen als auch für den technischen Domänenexperten, ver- 
ständlich sind. Dies ist eine wichtige Voraussetzung, um in der tatsächlichen 
Praxis gemeinsam das Prozesswissen formalisieren zu können. 


Grundsätzlich können verschiedene Ablaufmodelle zur Formalisierung her- 
angezogen werden. In dieser Arbeit werden, aufgrund diverser positiver Ei- 
genschaften, UML Aktivitätsdiagramme exemplarisch eingesetzt. 


Kurzfassung 


Für das dargestellte Konzept können aber auch andere Modelle, wie z.B. Er- 
eignisgesteuerte Prozessketten (EPK), genutzt werden. Ermöglicht wird dies 
durch insgesamt drei Transformationsschritte. Sie entkoppeln die Ablaufmo- 
delle von der eigentlichen Wissensbasis. Dabei werden mittels zweier (bereits 
existierender) Transformationen die Ablaufmodelle zunächst in Workflow- 
Netze und später in Prozessbäume überführt. Die anschließende Überfüh- 
rung eines Prozessbaums in einen FHIR-Plan ist Beitrag dieser Arbeit. Hierin 
wird gezeigt, dass die dargelegte Transformation sowohl für Hin- als auch für 
Rückrichtung strukturerhaltend ist. 


Darauf aufbauend wird eine neu entwickelte Transformation eines FHIR- 
Plans in ein expertenbasiertes Dynamisches Bayes-Netz (DBN) zur Phasen- 
erkennung besprochen. Das Ergebnis wird anhand zweier prototypischer 
Vertreter chirurgischer Interventionen beleuchtet: die endoprothetische Ver- 
sorgung eines Patienten mittels einer totalen Endoprothese der Hüfte sowie 
die laparoskopische Entfernung der Gallenblase. In einer Vor- und Realstu- 
die sowie an einem öffentlichen Datensatz werden die Modelle schließlich 
einer Leistungsbewertung unterzogen. Zum Einsatz kommt hierfür eine ver- 
schachtelte Kreuzvalidierung. Unter Berücksichtigung der gewählten Werte 
(Precision, Recall, Jaccard-Score) zeigt sich die Überlegenheit des Ansatzes 
bezüglich der Vergleichsmodelle. 
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1 Einleitung 


Künstliche Intelligenz (KI) wird viele Aspekte der klinischen Praxis und des 
Gesundheitswesens entscheidend mitprägen. Dies betrifft nach [Yu18] u.a.: 


e die Unterstützung bei der Diagnosestellung, 
e die Assistenz bei chirurgischen Interventionen, 
« die Auswertung der Ergebnisse bildgebender Verfahren, 


e die Unterstützung in der Arzneimittelforschung. 


Die Beiträge der vorliegenden Dissertation zur Formalisierung und Analyse 
von medizinischen Prozessen lassen sich in den beiden erstgenannten Berei- 
chen verorten (vgl. Abbildung 1.1). Sprich: der Bestimmung der zugrunde- 
liegenden Erkrankung eines Patienten und der Assistenz bei chirurgischen 
Behandlungsmaßnahmen. 


Als Grundlage für Künstliche Intelligenz (KI)-Methoden stehen klassischer- 
weise große Datenmengen im Fokus. Im Bereich der bildgebenden Verfahren 
können beispielsweise anhand großer Lern-, Validierungs- und Teststichpro- 
ben Tumore in Bildschichten segmentiert oder Anomalien erkannt werden. 


In anderen Bereichen stehen geeignete Daten nur eingeschränkt oder un- 
strukturiert zur Verfügung. Zum Beispiel liegen bei Diagnosestellung häufig 
große Teile der Daten in Form von Freitexten vor und sind damit für daten- 
basierte KI-Methoden nicht oder nur unzureichend nutzbar. Um die Daten- 
schätze mittels Methoden der KI zu bergen, wird deswegen üblicherweise ei- 
ne Strukturierung der Daten angestrebt. In der Vergangenheit entstand so ein 
ganzer Strauß an verschiedenen Insellösungen zur Strukturierung und Spei- 
cherung. Gleichzeitig erschweren Insellösungen aber Daten auf weltweiter 
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Abbildung 1.1: Wichtige Aspekte auf dem Gebiet des Gesundheitswesens und der klinischen 
Praxis, in denen künstliche Intelligenz nach [Yu18] einen prägenden Einfluss 
haben wird. Die Beiträge der vorliegenden Dissertation liegen in den markierten 
Bereichen d.h. bei der Unterstützung der Diagnosestellung sowie der Assistenz 
bei chirurgischen Interventionen (vgl. Marker A). 


Ebene zu sammeln, auszutauschen und für nachfolgende Auswertungen zu 
nutzen. Abseits von Insellösungen entstand somit der Bedarf an weltweit ak- 
zeptierbaren Lösungen und Interoperabilität. 


In diesem Zuge gewannen die sogenannten Fast Healthcare Interoperability 
Resources (FHIR) in den letzten Jahren zunehmend an Bedeutung [Leh19a, 
Hub20]. Schon im Jahr 2018 verständigten sich die Technologieunternehmen 
IBM, Microsoft, Oracle, Google, Amazon und Salesforce in einer gemeinsamen 
Erklärung auf die Notwendigkeit, bestehende Hemmnisse bei der medizini- 
schen Datenrepräsentation zu beseitigen. In dieser Erklärung werden FHIR 
und angeschlossene Projekte bereits explizit genannt [Inf18, Leh19a], denn 
sie sollen es ermöglichen, medizinische Daten mit Methoden der KI weltweit, 
sowie unternehmensübergreifend effektiv und effizient nutzbar zu machen 


[Leh19b]. 


Weiterhin ergab sich speziell in Deutschland die Frage nach akzeptierbaren 
Softwarelösungen im Hinblick auf die Elektronische Patientenakte (ePA), de- 
ren Entwicklung durch entsprechende Gesetze in den Jahren zuvor angeregt 
wurden. Im Jahr 2019 stellten hierzu [Plo19] ein Konzept vor, welches FHIR 


1.1 Eigene Beiträge 


nutzt, um durch eine möglichst vertrauenswürdige Lösung eine hohe Akzep- 
tanz bei den Benutzern zu erreichen. Heute, im Jahr 2022, basieren Schnitt- 
stellen, sowie die auf der ePA ablegbaren und in Bearbeitung befindlichen 
medizinischen Informationsobjekte (MIO), wie beispielsweise Impfpass, Mut- 
terpass oder das Zahnärztliche Bonusheft, auf FHIR [Kas21]. 


Abgeleitet aus den genannten Entwicklungen, nutzt die vorliegende Disserta- 
tion FHIR als Vehikel zur Wissensrepräsentation im Rahmen der Prozessmo- 
dellierungen und erweitert dieses wo notwendig. 


Besonders in Bereichen, die datenarm aber wissensreich sind, kann darüber 
hinaus das verfügbare Expertenwissen eine entscheidende Rolle spielen. Dies 
gilt beispielsweise für medizinische Prozesse im Rahmen der Diagnosestel- 
lung oder der chirurgischen Interventionen, die interessanterweise häufig 
noch unzureichend unter den oben genannten Gesichtspunkten betrachtet 
werden. Wichtig werden solcherlei Überlegungen vor allem dann, wenn 
am Ende eine praxistaugliche Assistenz im Rahmen medizinischer Prozesse 
konzipiert und bereitgestellt werden soll. Aus diesem Grunde beschäftigen 
sich die Beiträge der vorliegenden Arbeit auch mit diesem Aspekt. 


1.1 Eigene Beiträge 


Einer der Beiträge dieser Dissertation ist eine strukturierte Vorgehensweise 
zur Wissensakquisition und -formalisierung von medizinischen Prozessen für 
eine KI-basierte Entscheidungsunterstützung im Bereich der medizinischen 
Diagnostik und Therapie, vgl. hierzu Abbildung 1.2. 


Medizinische Prozesse werden dabei durch Prozessmodelle beschrieben. Hier- 
zu muss das vorhandene Expertenwissen im Dialog mit dem Experten for- 
malisiert werden. Ziel der Formalisierung ist letztlich ein für alle Seiten ver- 
ständliches Ablaufmodell, welches den Ablauf der einzelnen Prozessschritte 
des medizinischen Prozesses beschreibt. Grundsätzlich können für ein sol- 
ches Ablaufmodell unterschiedliche Prozessmodelle herangezogen werden. 
Aufgrund ihrer Verständlichkeit auch für nicht-technische Nutzer eignen sich 
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Abbildung 1.2: Die Formalisierung des menschlichen Wissens kann im Dialog der medizini- 
schen und technischen Domänenexperten vollzogen werden. Ergebnis ist ein 
für alle Seiten verständliches Ablaufmodell, welches über Zwischenmodelle in 
die FHIR-basierte Wissensbasis gelangt. Zusätzlich können Methoden zur Ent- 
deckung von Abläufen (vgl. Process Mining) eingebunden werden. Aus der Wis- 
sensbasis können wiederum Abgleichmodelle für die Bereitstellung von Assis- 
tenzfunktionen erzeugt werden. 


insbesondere grafische Prozessmodelle, wie beispielsweise Geschäftsprozess- 
modell und -notation (BPMN), Ereignisgesteuerte Prozessketten (EPK) oder 
UML Aktivitätsdiagramme [K009]. In dieser Arbeit werden UML Aktivitäts- 
diagramme zur Modellierung und den Wissenserwerb genutzt. Die Beiträge 
der Arbeit sind allerdings von den eben genannten, konkreten Prozessmodel- 
len über Zwischenmodelle entkoppelt, sodass diese mit alternativen Modellen 
zusammenspielen können. Weiterhin bieten die Zwischenmodelle eine Naht- 
stelle zu unterschiedlichen Techniken für das datenbasierte Entdecken von 
Prozessen. 


Die in den Prozessmodellen enthaltene Information muss schließlich für eine 
Wissensbasis verfügbar gemacht werden. Dafür werden die im Expertendia- 
log erstellten UML Aktivitätsdiagramme in FHIR überführt, sodass die Abläu- 
fe schließlich als FHIR-Pläne hinterlegt werden können. Dies erfolgt durch 
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drei Transformationen, von denen zwei bereits Stand der Technik sind. Die 
dritte Transformation stellt einen eigenen Beitrag dar - hierin werden Pro- 
zessbäume und FHIR-Pläne hin- und rücktransformiert. 


In einem weiteren Beitrag wird eine probabilistische Erweiterung einer FHIR 
Ressource vorgestellt und schließlich wird in einem finalen Beitrag ein pro- 
babilistisches Abgleichmodell für die Assistenz im Rahmen chirurgischer In- 
terventionen abgeleitet. Das Abgleichmodell wird dann anhand zweier proto- 
typischer Vertreter evaluiert. 


1.2 Gliederung 


Die vorliegende Arbeit enthält sechs Kapitel, deren Inhalt nachstehend skiz- 
ziert wird: 


Kapitel 2 beleuchtet die Grundlagen der wissensbasierten Modellierung. 
Hierbei wird zunächst auf Expertensysteme und deren Zusammen- 
hang mit Künstlicher Intelligenz eingegangen. Weiterhin werden 
Bayes-Netze als Problemlösungskomponente ausführlich erläutert 
und schließlich die sogenannten Fast Healthcare Interoperability 
Resources zur Wissensrepräsentation dargestellt sowie erweitert. 


Kapitel 3 widmet sich den Begrifflichkeiten der Prozessmodellierung und 
stellt Notationselemente sowie Verschaltungen von Petri-Netzen, 
UML Aktivitätsdiagrammen als auch Prozessbäumen vor. 


Kapitel 4 stellt die entwickelte Transformation zwischen Prozessbäumen und 
FHIR dar. Zusätzlich wird die Strukturerhaltung bei Hin- und Rück- 
transformation beleuchtet. 


Kapitel 5 beschreibt die medizinischen Hintergründe zweier prototypischer 
chirurgischer Intervention: Zum einen die laparoskopische Chole- 
zystektomie und zum anderen die totale Endoprothese der Hüfte. 
Darauf aufbauen wird auf die Konstituenten des zugrunde liegen- 
den Problems und die Bewertung der Problemlösung eingegangen. 
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Schließlich wird ausgehend vom Stande der Technik der eigene Bei- 
trag umrissen und schließlich detailliert vorgestellt. 


Kapitel 6 fasst die Erkenntnisse zusammen und gibt einen Ausblick. 


Diese Arbeit enthält neben den beschriebenen Kapiteln einen medizinischen 
Glossar (ab Seite 207), ein Symbolverzeichnis (ab Seite 209), ein Literaturver- 
zeichnis (ab Seite 215), ein Verzeichnis der eigenen Publikationen (ab Seite 
237) und ein Verzeichnis betreuter studentischer Arbeiten (ab Seite 245). 


2  Wissensbasierte Modellierung 


Wissensbasierte Modellierung steht in engem Zusammenhang mit dem For- 
schungsgegenstand der Wissensbasierte Systeme (WBS), die in Kapitel 2.1 
vorgestellt werden. Speziell auf den Aufbau von Expertensystemen wird im 
anschließenden Kapitel 2.2 eingegangen. WBS und Expertensysteme haben 
sich als Teilgebiet der KI entwickelt - ein Überblick und eine Einordnung wird 
in Kapitel 2.3 vorgenommen. Auf Wahrscheinlichkeitsbegriffe und -theorie 
wird in Kapitel 2.4 gemeinsam mit Bayes-Netze als Problemlösungskompo- 
nente eingangen. Schließlich werden als Grundlage zur Wissensrepräsentati- 
on die sogenannten Fast Healthcare Interoperability Resources (FHIR) in Ka- 
pitel 2.5 vorgestellt. 


2.1 Wissensbasierte Systeme 


Über die Zeit hinweg finden sich verschiedene Definitionen des Begriffs 
WBS [Ort77, Kur92, Ake09, Pup13b]. Allen gemein ist die Aufspaltung der 
Architektur des Systems in zwei Bereiche (vgl. Abbildung 2.1). Auf der einen 
Seite steht die sogenannte Wissensbasis mit spezifischem Wissen über den 
Anwendungsbereich. Dem gegenüber steht die tatsächliche Verarbeitung des 
Wissens (Wissensverarbeitung) in Form einer anwendungsunabhängigen 
Problemlösungskomponente. 


An Anlehnung an die Definitionen aus [Ort77, Kur92, Ake09, Pup13b], wird 
in der vorliegenden Arbeit ein WBS definiert als: 


2 Wissensbasierte Modellierung 


Definition 2.1. Ein WBS ist ein System oder Programm, bei dem das Wis- 
sen über ein Anwendungsgebiet (Wissensbasis) getrennt ist von allgemeinen 
Problemlösungsmethoden (Wissensverarbeitung). 


Diese Trennung hat zwei Vorteile: Zum einen können allgemeine Methoden 
zur Wissensverarbeitung herangezogen werden, die unabhängig von der Wis- 
sensbasis eines konkreten Anwendungsfalles sind und die auch auf weitere 
Anwendungen übertragbar sind. Zum anderen kann die Wissensbasis aktua- 
lisiert und erweitert werden, ohne dass dabei die Algorithmen der Wissens- 
verarbeitung angepasst werden müssen [Kol09]. 


Wissensverarbeitung 


Wissensbasis 


Abbildung 2.1: Auch wenn es verschiedenartige Definitionen des Begriffs WBS gibt, ist die Tren- 
nung zwischen Fachwissen über das Anwendungsgebiet des WBS und der ei- 
gentlichen Wissensverarbeitung mittels allgemeiner Problemlösungsmethoden 
allen Definitionen gemein. 


2.2 Expertensysteme 


In der Literatur findet sich üblicherweise eine Abgrenzung des Begriffs des 
Expertensystems zum Begriff WBS. Hierbei existieren verschiedene Sicht- 
weisen, von einigen Autoren werden die Begriffe auch synonym verwendet 
[Hop92]. Eine gängige Möglichkeit ein Expertensystem von einem WBS ab- 
zugrenzen ist die Herkunft des im System repräsentierten Wissens. Dabei sind 
Expertensysteme spezielle WBS, deren Wissen von Experten stammt [Wat86]. 


2.2 Expertensysteme 


Sie können somit als Teilmenge der WBS angesehen werden. Bei dieser Defi- 
nition bleibt es Auslegungssache, ob die Wissensbasis eines Expertensystems 
ausschließlich aus Expertenwissen bestehen muss. Denkbar ist auch eine da- 
tengetriebene Erweiterung der Wissensbasis durch Methoden des maschinel- 
len Lernens. 


In der vorliegenden Arbeit wird für Expertensysteme eine ähnliche Definition 
nach Puppe herangezogen [Pup13b]: 


Definition 2.2. Ein Expertensystem ist ein WBS, mit dem die Schlussfolge- 
rungsfähigkeit und das bereichsspezifische Wissen von Experten nachgebil- 
det werden soll. 


Diese Definition umfasst damit zwei Aspekte: 


1. Expertensysteme sind Teilmenge der WBS. 


2. Der Begriff Expertensystem entstammt einer externen Sichtweise und 
beschreibt, wie die Umwelt das System wahrnimmt. Speziell bleibt da- 
bei frei, wie das nachzubildende bereichsspezifische Wissen erworben 
wird. Denkbar sind verschiedene Wissensquellen (beispielsweise Da- 
tenbanken, Bücher, Leitlinien oder menschliche Experten [Bei19]), so- 
wie die (teilweise) Generierung der Wissensbasis mit dem Werkzeug 
des Maschinellen Lernens (beispielsweise Erlernen von Entscheidungs- 
bäumen zur Entwicklung der Wissensbasis [Beil19]) . 


Die Architektur eines Expertensystems besteht aus einzelnen Komponenten, 
die in einem Austausch miteinander stehen. Grundlegend sind aber nur die 
Wissensbasis und die Problemlösungskomponente. 


Die Wissensbasis bildet dabei den Kern eines Expertensystems - in ihr wird 
das benötigte Fachwissen über das Anwendungsgebiet des Expertensystems 
in einer geeigneten Repräsentationsform abgelegt [Kur92]. Unabhängig von 
der Art der Wissensrepräsentation kann der Inhalt einer Wissensbasis nach 


2 Wissensbasierte Modellierung 


[Pup13a] weiter unterteilt werden in sogenanntes fallspezifisches Wissen und 
bereichsbezogenes Expertenwissen‘. 


Dabei bezieht sich das fallspezifische Wissen ausschließlich auf eine konkrete, 
gerade betrachtete Problemstellung im Anwendungsgebiet des Expertensys- 
tems. Fallspezifisches Wissen kann aufgrund von Beobachtungen - im me- 
dizinischen Bereich beispielsweise aufgrund von Untersuchungsergebnissen 
eines Patienten - vorliegen. Das fallspezifische Wissen kann vom Benutzer 
des Expertensystems während der Nutzung eingegeben [Kna93] oder ohne 
direkte Benutzerbeteiligung erhoben werden [Bie13]. 


Das bereichsbezogene Expertenwissen bezieht sich im Gegensatz zum fall- 
spezifischen Wissen auf Wissen, das über einen einzelnen konkreten Fall aus 
dem Anwendungsgebiet des Expertensystems hinaus geht - es meint damit 
Wissen, das alle Fälle aus dem Anwendungsgebiet umfasst. Es kann sich da- 
bei um Fachwissen der Domänenexperten handeln - wie beispielsweise das 
Wissen über den Ablauf einer Operation. 


Am Anfang der Entwicklung eines Expertensystems steht die Akquisition des 
Fachwissens aus der Anwendungsdomäne. Zur Akquisition des Wissens dient 
im Expertensystem eine sogenannte Wissenserwerbskomponente?, die den 
Aufbau der Wissensbasis unterstützt [Bei19, Pup13b]. 


Da unterschiedliche Quellen für den Wissenserwerb in Frage kommen 
[Bei19], z.B. Leitlinien oder menschliche Experten, muss das Expertenwissen 
aus diesen Quellen im Schritt der Wissensakquisition geeignet erhoben und 
in einem Wissensmodell dargestellt werden können [Kur92]. 


Eine nicht zu unterschätzende Herausforderung ist dabei die Akquisition von 
Wissen mittels Expertendialog [Alt13]: Da das domänenspezifische Wissen 
eines Experten häufig nicht bewusst vorhanden ist, sondern unbewusst ange- 
wandt wird, gestaltet sich dessen Ermittlung und Strukturierung in der Praxis 


* Hinweis: Beierle unterteilt ähnlich in fallspezifisches Wissen und regelhaftes Wissen [Bei19]. 
Wobei letzteres im Sinne eines allgemeinen bzw. bereichsbezogenen Wissens zu interpretieren 
ist und nicht im Sinne der Form der Repräsentation in Form von Regeln. 

* Hinweis: Einige Autoren sprechen hier auch von der Wissensakquisitionskomponente (vgl. 
[Kur92, Alt13]). 
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häufig schwierig. Gleichzeitig kann das Ergebnis der Wissensakquisition aber 
maßgeblich für den Erfolg des Expertensystems verantwortlich sein. Der Pro- 
zess des Wissenserwerbs sollte daher sorgfältig vorbereitet und durchgeführt 
werden [Alt13]. 


Deswegen ist einer der Beiträge dieser Arbeit eine strukturierte Vorgehens- 
weise für die Wissensakquisition und -formalisierung für Expertensysteme 
im Bereich der medizinischen Diagnostik und Therapie. 


2.3 Künstliche Intelligenz 


Als Ursprung des Forschungsfeldes KI wird üblicherweise eine Arbeitstagung 
zur Maschinenintelligenz angesehen, die im Jahre 1956 von John McCarthy 
am Dartmouth College in New Hampshire organisiert wurde [McC04, Rus09]. 
Dabei erklärte McCarthy sinngemäß: „Ziel der Klist es, Maschinen zu entwi- 


ckeln, die sich verhalten, als verfügten sie über Intelligenz“. 


Als eine Möglichkeit eine solche Maschinenintelligenz zu messen, galt zu- 
nächst der Turing Test. Dabei tritt ein menschlicher Fragesteller mit zwei 
verschiedenen Gesprächspartnern in Kontakt, zu denen er weder Sicht- noch 
Hörkontakt hat. 


Über eine Tastatur und einen Bildschirm kann er mit den Gesprächspartnern 
kommunizieren. Kann der Fragesteller auch nach intensiver Befragung nicht 
sagen, welcher der beiden Gesprächspartner die Maschine ist, so hat die Ma- 
schine den Turing Test bestanden. Der Maschine wird dann ein dem Men- 
schen ebenbürtiges Denkvermögen unterstellt [Tur50]?. 


Hinweis: Schon zuvor hatte Alan Turing die zentrale Frage „Können Maschinen denken?“ for- 
muliert [Tur09]. Eine Frage die Hermann Schmidt sowie Norbert Wiener (vgl. das Wiener Filter 
bzw. Wiener-Kolmogoroff-Filter) mit dem Begriff „Kybernetik“ verknüpften [Wie48]. Nachhal- 
tig in den 1960er Jahren geprägt von Karl Steinbuch [Ste65], ist die Kybernetik heute weitest- 
gehend im Begriff der KI aufgegangen. 

Hinweis: Die Testergebnisse hängen also nicht von der Fähigkeit der Maschine ab, „korrekte“ 


» 


Antworten im Hinblick auf die Konstituenten des Problems zu geben, sondern nur davon, wie 
sehr ihre Antworten denen eines Menschen (bzw. der Menschen der Stichprobe) ähneln. 
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Jedoch wurde, insbesondere von dem Philosophen John Searle, Kritik am Tu- 
ring Test hervorgebracht: er prüfe nur auf Funktionalität und nicht auf Ver- 
ständnis. Um dies darzustellen, zog Searle das Gedankenexperiment des „Chi- 
nesischen Zimmers“ heran, vgl. [Sea80]. Dieses Gedankenexperiment beginnt 
zunächst mit der Hypothese, dass es gelungen ist eine Maschine zu bauen, die 
sich so verhält, als verstünde sie Chinesisch, d.h. die Maschine kann basierend 
auf einem chinesischen Eingabetext einen passenden Ausgabetext so bereit- 
stellen, dass sie im Turing Test einen chinesischen Muttersprachler überzeu- 
gen kann. 


Laut Searle stellt sich nun die Frage, ob eine solche Maschine tatsächlich Chi- 
nesisch versteht, oder ob sie das Verständnis des Chinesischen nur simuliert. 
Um diesen Unterschied zu verdeutlichen, beschreibt Searle eine angepasste 
Version des Turing Tests: Auch in seinem Experiment kommuniziert ein Fra- 
gesteller ohne Sicht- und Hörkontakt mit einem Gesprächspartner, der sich in 
einem anderen Zimmer befindet. In diesem Fall ist der Fragesteller jedoch chi- 
nesischer Muttersprachler und stellt seine Fragen demnach in chinesischen 
Schriftzeichen. Sein Gegenüber, in diesem Fall ein Mensch, ist des Chinesi- 
schen nicht mächtig. Hat er im Zimmer aber Zugriff aufeine Schriftsammlung 
in chinesischen Zeichen, die viele verschiedene Fragen und dazu passende 
Antworten enthält, kann er die Sequenzen an Schriftzeichen in den Fragen 
des Fragestellers auf der Ebene der Zeichenerkennung mit den Fragen in der 
Schriftsammlung vergleichen und so die passenden Antwortzeichen heraus- 
finden. Hierbei muss er weder Frage noch Antwort verstehen, kann aber sei- 
nem Gegenüber vorgaukeln, er verstünde Chinesisch. 


Kann also analog eine Maschine auf in chinesischer Schrift gestellte Fragen 
mit passenden chinesischen Schriftzeichen antworten, sodass sie den Turing 
Test besteht, kann hierdurch noch nicht angenommen werden, dass die Ma- 
schine tatsächlich versteht was sie übersetzt — also eine Art von Bewusstsein 
für die Problemstellung hat [Sea80]. 
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2.3.1 Sichten 


Ausgehend von diesen frühen Versuchen den Begriff der KI zu fassen und 
zu vermessen, haben sich über die Zeit eine Vielzahl an Definitionen entwi- 
ckelt, die teils kontrovers diskutiert werden [Mon20]. In Folge findet sich in 
der Literatur auch heute keine einheitliche Definition der KI (engl. Artifici- 
al Intelligence (AI)). Vielmehr wird der Begriff aus unterschiedlichen Sichten 
heraus nutzbar gemacht. 


Eine dieser Sichten betrifft das Vorhandenseins eines Bewusstseins seitens der 
Maschine (vgl. Tabelle 2.1). In diesem Sinne lässt sich basierend auf Searle 
die Kl in „stark“ (engl. strong) bzw. „schwach“ (engl. weak) einteilen [Sea80]. 
Man spricht von starker KI, sofern eine Maschine zu Selbsterkenntnis und 
Bewusstsein fähig ist und autonom handelt - die Maschine weiß in diesem 
Sinne also, was sie tut, warum sie es tut, und ist in der Lage, selbständig neue 
Aufgaben zu finden und diese zu reflektieren. Im Gegenzug spricht man von 
schwacher KI, wenn eine Maschine Verständnis nur „vortäuscht“, tatsächlich 
jedoch unreflektiert und ohne Bewusstsein eine Aufgabe abarbeitet [Sea80]. 


Eine weitere Sicht nimmt Bezug auf die Art der Aufgabe, die mittels KI be- 
wältigt werden kann, indem zwischen einer sogenannten „eingeschränkten“ 
(engl. narrow) und „allgemeinen“ (engl. general) KI unterschieden wird’. Die 
bislang erzielten großen Erfolge im Forschungsfeld der KI sind dem Bereich 
eingeschränkten KI zuzuschreiben: Zwar können Maschinen Menschen über- 
treffen, jedoch nur in einer eng gefassten Aufgabenstellung (beispielsweise 
Go-Spiel, Maschinelles Übersetzen) [Bun17, Kur05]. Im Falle der allgemeinen 
KI, ist eine Maschine unabhängig von einem konkreten Anwendungsfall in 
der Lage, verschiedenartige Probleme aus unterschiedlichen Bereichen anzu- 
gehen [Mon20]. 


Wie eine Problemstellung innerhalb der KI repräsentiert und eingebracht 
wird, wurde schon zu Beginn der KI-Forschung intensiv untersucht. Die 


1 Hinweis: Das englische Wort „narrow“ wird in der deutschsprachigen Literatur teils mit 
„schwach“ übersetzt. Unabhängig davon wird das englische Wort „general“ auch mit „univer- 
sell“ übersetzt. 
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sogenannte „symbolische“ (engl. symbolic) KI stellt eine Sichtweise dar, bei 
der eine symbolische Ebene [New76, New07], beispielsweise in Form von 
durch den Menschen vorgegebener Regeln, genutzt wird’. Aus der heuti- 
gen Perspektive wird dieser Ansatz teilweise auch als „Top-Down“ Ansatz 
bezeichnet, während abgrenzend dazu der „Bottom-Up“ Ansatz in der An- 
wendung subsymbolischer Methoden des Maschinellen Lernens im Sinne der 
Problemstellung besteht. 


Letzterer wird, gerade bei Verwendung von Künstlichen Neuronalen Netzen, 
mit dem Begriff der „konnektionistischen“ (engl. connectionist) oder „neuro- 
nalen“ (engl. neural) KI verknüpft [Sm087, Smo90]. 


Tabelle 2.1: Drei Sichten auf den Begriff der KI. Die Sichten beleuchten verschiedene Aspekte, 
wie das Vorhandensein eines Bewusstseins, der Universalität der Intelligenz oder 
der Repräsentation der Problemstellung. 


Sicht auf KI Ausprägungen 


Bewusstsein Schwache oder starke KI 
(engl. weak or strong Al) 


Universalität Eingeschränkte oder allgemeine KI 
(engl. narrow or general Al) 


Repräsentation Symbolische oder subsymbolische KI 
(engl. symbolic or subsymbolic AI) 


2.3.2 Verbindungen 


Das Forschungsfeld der KI ist mit verschiedenen weiteren Forschungsfeldern 
verknüpft. Im Bereich der Informatik bestehen starke Verbindungen zu den 


* Hinweis: In diesem Zusammenhang wird die symbolische KI auch als Good Old-Fashioned 
Artificial Intelligence (GOFAI) bezeichnet [Hau89] und bezieht sich damit auf die symbolische 
Repräsentation der Wissensbasen früherer Expertensysteme. 


14 


2.3 Künstliche Intelligenz 


Künstliche 
Intelligenz 


Wissensbasierte 
Systeme 


Experten- © 


systeme 


Maschinelles 
Lernen 


Abbildung 2.2: Die Abbildung zeigt ein Mengendiagramm zur Verdeutlichung der Zusammen- 
hänge zwischen den Begriffen Künstliche Intelligenz, Maschinelles Lernen, Wis- 
senbasierte Systeme und Expertensysteme. Die Punkte A, BundC verdeutlichen 
den Schnitt dieser Mengen mit der Menge der Künstlichen Intelligenz. Dabei 
nutzt KI die Methoden des Maschinellen Lernens (C). Neben dem Aspekt des 
Lernens spielt auch die Wissensbasierte Modellierung in Form von Wissensba- 
sierten Systemen und insbesondere Expertensystemen eine Rolle. Letztere kön- 
nen rein auf Formalisierung von Expertenwissen (A) oder auf einer Kombination 
mit erlerntem Wissen (B) basieren. 


Methoden des Maschinellen Lernens. Hierbei kann KI die Methoden des Ma- 
schinellen Lernens auf symbolischer Ebene (bspw. über Entscheidungsbäume) 
oder subsymbolischer Ebene (bpsw. Neuronale Netze) nutzen (vgl. Abbildung 
2.2, Punkt C). Die Teilmenge des Bereichs des Maschinellen Lernens, die sich 
speziell mit mehrschichtigen Neuronalen Netzen beschäftigt, wird auch Tie- 
fes Lernen (engl. Deep Learning [Goo16]) genannt - diese Teilmenge ist aus 
Gründen der Übersichtlichkeit nicht Bestandteil der Abbildung. 
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Die Begriffe dieser Mengen werden teils synonym mit dem Begriff der KI ver- 
wendet. Sie werden hier aber als mögliche Werkzeuge zur Umsetzung von KI 
gesehen. 


Für das Lösen konkreter Anwendungsprobleme im Rahmen der KI sind neben 
dem Aspekt des Lernens jedoch auch weitergehende Aspekte von Interesse. 
Beispielsweise die wissensbasierte Modellierung im Kontext der Experten- 
systeme, die u.a. die Trennung von Wissensbasis und Wissensverarbeitung 
vorsieht (vgl. Kapitel 2.1 und 2.2 ab Seite 7). Dabei kann die Wissensbasis 
klassisch durch Formalisierung menschlichen Vorwissens befüllt werden (A). 
Eine Kombination mit Methoden des Maschinellen Lernens, also der Kombi- 
nation von menschlichen Vorwissen und Wissen aus Daten, ist dabei ein viel- 
sprechender aber auch herausfordernder Ansatz der im Rahmen dieser Arbeit 
verfolgt wird (B)'. 


2.4 Bayes-Netze als Komponente zur 
Problemlösung 


Zur Einführung werden verschiedene Wahrscheinlichkeitsbegriffe in Kapitel 
2.4.1 beleuchtet. Daran anschließend folgen in Kapitel 2.4.2 die Grundlagen 
der Wahrscheinlichkeitstheorie. In den darauf folgenden Kapiteln 2.4.3 und 
2.4.4 werden Bayes-Netze genauer besprochen. 


2.4.1 Wahrscheinlichkeitsbegriffe 


Historisch haben sich unterschiedliche Deutungen des Wahrscheinlichkeits- 
begriffs herausgebildet - die frequentistische Sichtweise und die Bayes’sche 
Sichtweise - auf die im Folgenden kurz eingegangen wird. 


* Hinweis: Teils wird die Verbindung von KI mit menschlichem (Vor-)wissen auch als Hybride 
Intelligenz bezeichnet [Kam16, Del19]. 
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Die frequentistische Sichtweise wurde erstmals im 19. Jahrhundert von John 
Venn als mathematische Theorie ausgearbeitet, vgl. [Ven66]. Diese Sichtwei- 
se interpretiert die Wahrscheinlichkeit für das Eintreten eines Ereignisses als 
die relative Häufigkeit, mit der dieses Ereignis in einer unendlichen Anzahl 
gleicher und voneinander unabhängiger Zufallsexperimente auftritt. Wahr- 
scheinlichkeit wird in der frequentistischen Sicht also auf einen bestimmten 
physikalischen Prozess bzw. dessen Ergebnis bezogen. 


Damit kann der frequentistische Wahrscheinlichkeitsbegriff dann angewen- 
det werden, wenn Ereignisse beliebig oft und unter gleichen Umständen wie- 
derholbar sind oder dies zumindest denkbar wäre. So beispielsweise beim 
Münzwurf oder beim Erfassen einer Messgröße. Nicht möglich ist jedoch eine 
Bewertung von einmaligen Ereignissen („Wie hoch ist die Wahrscheinlichkeit, 
dass es morgen Nachmittag regnet?“) oder von Hypothesen („Es gibt Leben 
in anderen Galaxien“). 


Dies gelingt jedoch mittels des Bayes’schen Wahrscheinlichkeitsbegriffes, der 
den frequentistischen Wahrscheinlichkeitsbegriff erweitert [Kor10] und es 
insbesondere erlaubt, Vorwissen, beispielsweise von Experten, einzubeziehen 
[Mor90]. 


Die Bayes’sche Deutung interpretiert Wahrscheinlichkeit als ein Maß dafür, 
wie sehr man - unter Berücksichtigung vorhandenen Wissens, Annah- 
men und Daten - vom Eintreten eines Ereignisses überzeugt ist [Le619]. 
Man spricht daher auch von der Interpretation der Wahrscheinlichkeit als 
„Degree-of-Belief“ (deutsch: Grad-des-Dafürhaltens), der einen Wert zwi- 
schen 0 (unglaubwürdig, falsch) und 1 (glaubwürdig, wahr) annehmen kann. 
Wahrscheinlichkeit ist damit also nicht nur eine Funktion des Ereignisses an 
sich, sondern zusätzlich abhängig vom Wissensstand [Mor90]. 


Innerhalb der Bayes’schen Deutung gibt es noch einmal zwei Strömungen mit 
unterschiedlichen Interpretationen des Grad-des-Dafürhaltens: Die subjekti- 
ve Deutung und die objektive Deutung [Pre09]. 


Erstere interpretiert den Bayes’schen Wahrscheinlichkeitsbegriff als persönli- 
che Überzeugung eines Individuums. Der Grad-des-Dafürhaltens wird also als 
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eine individuelle, subjektive Meinung aufgefasst, die so gewählt werden soll- 
te, dass sie konform zu den Axiomen nach Kolmorogov [Kol33] ist [Mor90]. 
Beispielsweise sollten sich der Grad-des-Dafürhaltens, dass ein Ereignis pas- 
siert und der Grad-des-Dafürhaltens, dass dieses nicht passiert, zu 1 addieren. 
Beim Erheben von Wahrscheinlichkeiten werden daher spezielle Techniken 
angewandt [Win67], sodass sich anschließend eine zu den Axiomen nach Kol- 
mogorov konforme Wahrscheinlichkeitsverteilung ableiten lässt [Leo54]. 


Die objektive Deutung sieht im Grad-des-Dafürhaltens im Gegensatz zu 
dessen subjektiver Deutung keine individuelle Meinung. Der Grad-des- 
Dafürhaltens steht hier für eine allgemeine, neutrale Erwartung, die jeder 
mit dem gleichen Wissensstand teilen sollte. So sollte beispielsweise bei 
Nichtvorhandensein relevanter Evidenzen der Grad-des-Dafürhaltens ge- 
mäß des Indifferenz-Prinzips', gleichmäßig auf alle in Betracht kommenden 
möglichen Ereignisse verteilt werden [Eva19]. 


Auf dem Konzept der Maximalen Entropie basieren zudem weitere Metho- 
den zur Konstruktion allgemeiner A-priori-Wahrscheinlichkeitsverteilungen 
[Jay88]. Jeffrey schlug spezielle, sogenannte „nicht-informative“ Referenz- 
Wahrscheinlichkeitsverteilungen vor, die gegenüber einer Reparametrisie- 
rung der Modellparameter invariant sind [Jef46]. 


Für diese Arbeit von Bedeutung ist die subjektive Interpretation des Grad-des- 
Dafürhaltens, da sie es erlaubt, vorhandenes Expertenwissen durch Exper- 
tenbefragungen gezielt in die Wissensbasis einfließen zu lassen. Eine Heraus- 
forderung dabei ist, dass der Grad-des-Dafürhaltens in diesem Fall abhängig 
vom spezifischen Wissensstand und der Informationsverarbeitung der befrag- 
ten Person ist. Verschiedene Personen können demselben Ereignis somit un- 
terschiedliche Wahrscheinlichkeiten zuordnen [Eis13]. Betrifft die Einschät- 
zung der Experten jedoch empirische Größen, wie in dieser Arbeit, ist eine 
valide Annahme, dass sich die angegebenen Wahrscheinlichkeiten zumindest 
ähneln werden - sofern die Experten einen ausreichend großen, ähnlichen 


* Hinweis: Auch als Prinzip des unzureichenden Grundes bezeichnet [Lau98]. 
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Erfahrungsschatz besitzen. Denn nach Morgan und Henrion konvergiert ei- 
ne subjektiv gewählte Wahrscheinlichkeitsverteilung einer empirischen Grö- 
Be gegen deren frequentistische Wahrscheinlichkeitsverteilung, wenn für die 
Konstruktion der subjektiven Verteilung mehr und mehr Evidenzen herange- 
zogen werden [Mor90]. 


Der erfahrene Experte kann in der hier vorgebrachten Argumentation als Be- 
obachter historischer, nicht in einer Datenbasis vorhandenen Evidenzen an- 
gesehen werden, die auf dem Wege der Expertenbefragung dennoch implizit 
in die Wissensbasis eingebracht werden können. Weiterhin existieren in der 
Literatur diverse Verfahren zur Kombination unterschiedlicher Expertenmei- 
nungen [Jac95]. 


2.4.2 Wahrscheinlichkeitstheorie 


Ein zentrales Element der Wahrscheinlichkeitstheorie ist ein Ereignis (vgl. 
Abschnitt 2.4.1). Dieses kann beispielsweise gegeben sein durch das Ergeb- 
nis eines Glücksrad-Gewinnspiels, wie in Abbildung 2.3 dargestellt. 


Es werde der Raum solcher Ergebnisse mit Q bezeichnet. Für den Ereignis- 
raum S gelten nun die drei Eigenschaften: 


1. ØESundQES, 
2. Wenn q, f E S, danna Uf E S, 


3. Wenn & E S, dannQ\a E S. 


Nun müssen für einen Abbildung von S nach R und mithin für eine Wahr- 
scheinlichkeitsverteilung P über (Q, S) noch die drei Axiome nach Kolomo- 
gorow [Kol33] erfüllt sein: 


1. P(a) > 0 für alle æ ES, 
2. P(Q) = 1, 
3. Wenn a,ß E S und æ N f = Ø, dann P(a U f) = P(a) + P(P). 
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S={{L IL IM}, ————_» 1 

I (I, I), 
amn — > 03 

II @ {I, I}, 


Ul m ——— 05 


_W { } — 0 


9 = {I, II, M} 
Abbildung 2.3: Glücksrad-Gewinnspiel in Anlehnung an [Bau14]. 


Als anschauliches Beispiel sei das Glücksrad-Gewinnspiel in Abbildung 2.3 
gegeben. Die Flächen des Rades sind mit römischen Ziffern versehen. Der Er- 
gebnisraum ist durch Q = {I, I, M} gegeben. Die Potenzmenge S möglicher 
Ereignisse beinhaltet sowohl Q = {I, H, III} als auch Ø = { }. Das Ereignis 
a = {I} € S repräsentiert ein gerades Ergebnis. Es gilt Q\a = {, I} € S. 
Sei £ = {I, M} € S, dann ist ebenso a U £ = {I, I, IM} € S. 


Wenn nun die Wahrscheinlichkeit proportional zur Fläche vergeben und mit 
der Gesamtfläche normiert wird, dann gilt für Abbildung P(-) zum Beispiel, 
dass P(a) = P({II}) = 0,5. Weil weiterhin æ Nn 6 = Ø, gilt P(œx u £) = 
P({I, I, DI} ist gleich der Summe der einzelnen Abbildungen P(a) + P(8) = 
PCI) + POL UR) = 1. 


Definition 2.3. Die bedingte Wahrscheinlichkeit ist die Wahrscheinlichkeit 
des Ereignisses 6 unter Kenntnis des Eintretens des Ereignisses a: 


Plan p) 


PED) = — pn 


(2.1) 


Wie sich leicht nachrechnen lässt, ergibt sich die bedingte Wahrscheinlichkeit 
für die konkreten, sich ausschließende Ereignisse, a = {I} und 6 = {I, III} zu: 
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P(ß|a) = 0. Das bedeutet, dass sich die a-prior bekannte Wahrscheinlichkeit 
P(ß) = 0,5 unter Kenntnis des Eintretens des Ereignisses a auf P(ß]a) = 0 
reduziert hat. 


Sei nun ein weiteres Ereignis y = {III} mit P(y) = 0,25 gegeben. Die bedingte 
Wahrscheinlichkeit P(y|ß) ergibt sich nach Gleichung (2.1) zu: 


P(Boy) PAMA PEI _ 025 _ 


PA pam) = PUL = 0.75 =O 


P(y|B) = 


Die a-priori Wahrscheinlichkeit P(y) = 0,25 hat sich also unter Kenntnis des 
Ereignisses ß (d.h. es liegt ein ungerades Ergebnis vor) auf P(y|ß) = 0,3 er- 
höht. Damit ergibt sich die bedingte Wahrscheinlichkeit anschaulich aus dem 
Verhältnis der Ergebnisse die sowohl in £ als auch in y liegen zu den Ergeb- 
nissen die in 6 liegen [Kol09]. 


Um die Kettenregel der bedingten Wahrscheinlichkeiten zu erhalten, kann 
Gleichung 2.1 umgestellt werden zu: 


Pa N £) = Pla)P(Ble). (2.2) 
Allgemein gilt: 


Definition 2.4. Die Kettenregel der bedingten Wahrscheinlichkeiten ist de- 
finiert als: 


Pag N ... N ag) = P(A) P(A, lao)... Plakl&oN --Nak-ı)- 


Aus Gleichung 2.2 folgt unter Ausnutzung von 


P(anB)=P(BNa) sowie 
P(a)P(pla) = P(B)P(a|B) 


und Auflösung nach P(a|ß) die nachfolgende Definition. 
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Definition 2.5. Der Satz von Bayes ist definiert als 


PEOP) 


Pals) = -R 


Dieser ergibt sich ebenso über Gleichung 2.1 derart dass, 


Plang) 
piap = PEND 2O O _ PEOP) 
"PA T O O A 


Sprich: Mit dem Satz von Bayes lässt sich aus den a-priori Wahrscheinlich- 
keiten P(&) und P(ß) sowie der Likelihood P($|«) die a-posteriori Wahr- 
scheinlichkeit P(a|6) berechnen. Das ist besonders dann nützlich, wenn sich 
in der praktischen Anwendung die a-posteriore Wahrscheinlichkeit P(a]|ß) 
nicht oder nur unter enormen Aufwand bestimmen lässt. 


Weiterhin kann von Interesse sein, wie Ereignisse voneinander abhängen. Für 


eine vollständige Unabhängigkeit gilt [Kol09]: 


Definition 2.6. In P ist ein Ereignis æ unabhängig von einem Ereignis £, also 
P F (æ L f), wenn P(a|ß) = P(a) oder wenn P(P) = 0. 


Oder aus einer andere Perspektive betrachtet: P genügt (æ L £) genau dann 
wenn P(an £) = P(a)P(P): 


Plan) _ P(a)P(B) 
PG) PO) 


Im Beispiel des Glücksrad-Gewinnspiels ist ein Ereignis æ, = {II} unabhängig 


P(alp) = = P(a). 


von einem Ereignis a, = {II} aus einer vorangegangen Drehung des Rades. 
Es können aber auch Ereignisse der selben Drehung unabhängig voneinander 


sein. 


Zur Veranschaulichung werde das Glücksrad aus Abbildung 2.3 auf 6 Kreis- 
segmente zu einem fairen Glücksrad erweitert: Q = {I, H, II, IV, V, VI} so- 
wie PAD) = PAID = PAM} = P(IVD = POV} = PCV). Für dem 
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fairen Glücksrad-Gewinnspiel gilt nun, dass die zwei Ereignisse der selben 
Drehung a = {I, M, V} und 6 = {I, I} unabhängig voneinander sind, denn 
P(a|6) = P(a). Oder anders ausgedrückt: die a-priore Wahrscheinlichkeit 
eines ungerades Ergebnisses P(a) = 0,5 bleibt auch bei Kenntnis des Ereig- 
nisses f erhalten. 


Ereignisse können allerdings auch nur bedingt unabhängig sein. Hierfür muss 
gelten [Kol09]: 


Definition 2.7. In P ist ein Ereignis æ bedingt unabhängig von Ereignis f 
gegeben Ereignis y, also P F (a L Bly), wenn P(a|B Ny) = P(aly) oder wenn 
P@Ny) =0. 


Oder alternativ betrachtet: Eine Verteilung P genügt (a L |y) genau dann 
wenn Plan Bly) = Plaly)P(£ly). 


Gegeben sei wieder das 6-segmentige, faire Glücksrad. Darüber hinaus sei- 
en zunächst zwei abhängige Ereignisse gegeben: a = {I} und 6 = {I, III, V}. 
Gegeben eine weiteres Ereignis y = {I, III} sind a und £ allerdings bedingt 
unabhängig: P(a|6 N y) = PL} | {L I, V} n {L UD) = PEL | {1, I) = Plaly). 


Wie zuvor beschrieben, können Ereignisse anschaulich über Mengen von 
Ergebnissen beschrieben werden. In der Praxis werden Ergebnisse häufig 
über Werte referenziert und zu Mengen gebündelt. Bei der fairen Glücksrat- 
Lotterie könnte dies zum Beispiel die Menge alle ungeraden Ergebnisse 


sein. 
Nach [Kol09] ist die Zuweisung solcher Werte zu einem Ergebnis gegeben 
durch: 


Definition 2.8. Eine Zufallsvariable X sei definiert als eine Funktion Fy. 
Diese Funktion weist jedem Ergebnis w E€ © einen Wert x zu. 


Ein Ereignis kann also über {w € Q : Fx(@) = x} angegeben werden - oder 
in Kurzschreibweise X = x. Dabei wird eine Zufallsvariable X als diskret 
bezeichnet, wenn der Wertebereich Val(X) von X endlich oder abzählbar ist 
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- sie kann aber auch kontinuierlich sein, beispielsweise reellwertig [Nea04]. 
Gilt | Val(X)| = 2, wird die Zufallsvariable X in dieser Ausarbeitung als binär 
bezeichnet. 


Im Beispiel der fairen Glücksrad-Lotterie weise eine Zufallsvariable X jedem 
Ergebnis zu, ob dieses ungerade oder gerade ist. Das bedeutet, der Werte- 
bereich der binären Zufallsvariablen ist gegeben durch den Wertebereich 
Val(X) = {ungerade, gerade}. Ein bestimmtes Ereignis kann zum Beispiel an- 
gegeben werden als {w € Q : Fx(w) = gerade} = {IL IV, VI}. In Verbindung 
mit P(-) ergibt sich die Schreibweise: P(X = gerade) = P({II, IV, VI}. Sofern 
sich aus dem Kontext die Zufallsvariable bereits ergibt, wird diese auch 
weggelassen, also im Beispiel statt P(X = gerade) vereinfachend P(gerade) 
geschrieben. 


2.4.3 Definition 


Um im Rahmen einer probabilistischen Wissensbasis eine multivariate Ver- 
teilung P über Zufallsvariablen X ., = Xp =X, angeben zu können, muss 
eine Vielzahl an Parametern festgelegt werden. Selbst in einem einfachen Falle 
von binären Zufallsvariablen müssten 2"*! mögliche Ergebniskombinationen 
parametrisiert werden, d.h. 2”+! — 1 Parameter gesetzt werden. Für 12 binäre 
Zufallsvariablen ergeben sich also 4096 — 1 = 4095 Parameter. Offensichtlich 
steigt die Anzahl der Parameter exponentiell mit der Anzahl der Zufallsvaria- 


blen [Phi15b]. 


Problematisch ist dies zum Beispiel, wenn diese Parameter im Rahmen ei- 
ner Expertenbefragung erhoben werden sollen. Neben dem rein quantitativen 
Aspekt, ist die Frage, ob Experten dabei überhaupt sinnvolle Wahrscheinlich- 
keitswerte für sämtliche Ergebniskombination abschätzen können [Phil6b]. 
Aber auch wenn Wahrscheinlichkeitswerte aus gegebenen Daten robust ge- 
lernt werden sollen, kann dies im Hinblick auf die sehr große Anzahl an Para- 
metern und der dafür notwendigen Datenmenge problematisch sein [Kol09]. 
Solcherlei Gründe waren zunächst der Hemmschuh für den Einsatz probabi- 
listischer Wissensbasen in früheren Wissensbasierten Systemen bzw. Exper- 
tensystemen [Kol09]. 
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Mit Hilfe des Formalismus Bayes-Netz (BN) und der Ausnutzung von Unab- 
hängigkeit zwischen Zufallsvariablen können probabilistische Wissensbasen 
allerdings kompakter dargestellt und handhabbar repräsentiert werden. 


Definition 2.9. Ein BN über den Zufallsvariablen ER = Xo OA Xn ist ge- 
geben durch ein Tupel 


(G,P), (2.3) 
wobei G einen gerichteten, azyklischen Graphen 
G = (V, £) (2.4) 


und 


PX...) = [P Pax) (2.5) 
i=0 


die gemeinsame Wahrscheinlichkeitsverteilung repräsentieren [Kol09]. 


Der Graph G wird verwendet, um Abhängigkeiten zwischen Zufallsvariablen 
X „.„ Zu definieren. Er wird auch als Struktur des BN bezeichnet und äußerst 
sich als gerichteter (engl. directed) azyklischer Graph (DAG). Seine Knoten- 
bzw. Vertexmenge V repräsentiert die Zufallsvariablen X .,- 


Während eine gerichtete Kante v; > vj der Kantenmenge £ eine direkte Ab- 
hängigkeit zwischen zwei Variablen angibt, symbolisiert eine fehlende Kante 
die Unabhängigkeit zweier Variablen’. 


1 Hinweis: Da Graph G sowohl gerichtet als auch azyklisch ist, existiert kein Pfad der von einem 
Knoten zu sich selbst zurück führt: A Pfad vj > ... > Uj. 
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Die gemeinsame Wahrscheinlichkeitsverteilung ist durch das Produkt aller 
bedingten Wahrscheinlichkeitsverteilungen gegeben, welche mit den Kno- 
ten von G verknüpft sind. Sie repräsentiert die Parameter des BN. Dabei be- 
zeichnet Pa(X,) die Menge der Eltern’ einer Zufallsvariablen X,. Im Graphen 
entspricht dies Knoten mit einer gerichteten Kante zum Knoten der mit X, 
verknüpft ist’. Die Faktoren P(X,|Pa(X,)) werden als Conditional Probability 
Distribution - bedingte Wahrscheinlichkeitsverteilung (CPD) bezeichnet. Im 
Falle diskreter Zufallsvariablen können sogenannte Conditional Probability 
Tables - bedingte Wahrscheinlichkeitstabellen (CPT) herangezogen werden, 
um die Verteilungen zu repräsentieren. 


Bei der obigen Darstellung wird angenommen, dass G eine I-MAP (engl. Inde- 
pence Map) der Wahrscheinlichkeitsverteilung P ist, d.h. dass jede Unabhän- 
gigkeitsbeziehung, die durch G gegeben ist, auch in P erfüllt ist? [Kol09]. Nur 
in diesem Falle kann die Berechnung von P durch die bedingten Unabhän- 
gigkeiten so vereinfacht werden, dass sich die „Kettenregel der Bayesschen 
Netze“, wie in Formel (2.5) dargestellt, ergibt. 


Um die für die I-MAP benötigten bedingten Unabhängigkeiten formal ange- 
ben zu können, müssen folgende Knotenmengen definiert werden: 


+ PaX i): Menge der Knoten, von denen eine gerichtete Kante nach X, 
führt (d.h. die Eltern von X is 


+ Desc(X pi Menge der Knoten, die auf einem von X, ausgehenden Pfad 
liegen (d.h. die Nachfahren von X ib 


e NDesc(X i): Menge der Knoten, die weder in Pa(X D noch in Desc(X J 
liegen, sowie nicht X f selbst sind (d.h. Nicht-Nachfahren von X i) 


* Hinweis: Durch den verwendeten DAG (mit seiner azyklischen sowie gerichteten Eigenschaft) 
ist sichergestellt, dass die Elternbeziehung eindeutig für jeden Knoten angegeben werden kann. 

* Hinweis: Wenn Pa(X,) = Ø, ist die Zufallsvariable X, ein Wurzelknoten und P(X,| Ø) = 
P(X,) gibt folglich die A-priori-Wahrscheinlichkeit an. 

3 Hinweis: Umgekehrt müssen aber nicht alle Unabhängigkeiten in P auch in G repräsentiert 
sein. 
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Auffassungs- 
gabe 
(A) 


P(K) P(A) 


Studien- 
fähigkeitstest 
(S) 


P(SIA) 


Empfehlungs- 
schreiben 
Œ) 


P(EIN) 


Abbildung 2.4: Bayessches Netz aus [Kol09, Kor10, Dar09] in Anlehnung an [Pea88]. Graph mit 
Knoten und zugeordneten bedingten Wahrscheinlichkeitsverteilungen. Es gilt: 
P(A,E,K,N,S) = P(A)P(E|N)P(NIA, K)P(K)P(S|A). 


Mit diesen Knotenmengen kann die lokale Markovbedingung, die der I-MAP 
zugrunde liegt, definiert werden: 


Definition 2.10. Der DAG G eines Bayes-Netzes, dessen Knoten v die Zu- 
fallsvariablen X ,., repräsentieren, steht für die Menge der lokalen bedingten 
Unabhängigkeiten 


NCG) = (X, L NDese(X,)|Pa(X,)) : i=0...n} (2.6) 


Die lokale Markovbedingung besagt also, dass jeder Knoten (X D bedingt 
unabhängig von nicht-nachfolgenden Knoten ist, gegeben seine Eltern, vgl. 
[K0109]. 


Beispielhaft sei das Bayes-Netz in Abbildung 2.4 gegeben. Sein DAG stellt 
Knoten und die jeweils verknüpften Zufallsvariablen aus der Menge 
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lich eine sprechende Bezeichnung. Deutet man die Kanten in einem kausalen 
Zusammenhang (Ursache und Wirkung), so können sowohl das Kursniveau 
als auch die Auffassungsgabe eines Studenten seine Note beeinflussen. Die 
Note wiederum beeinflusst die Qualität des Empfehlungsschreibens. Die Auf- 
fassungsgabe beeinflusst zudem das Ergebnis des Studienfähigkeitstest (engl. 
Scholastic Assessment Test, SAT)‘. Auch fehlende Kanten sind bedeutungs- 
tragend: Die nicht vorhandene Kante zwischen dem Knoten Kursniveau und 
dem Knoten Auffassungsgabe zeigt an, dass die verknüpften Zufallsvariablen 
K und A unabhängig voneinander sind. 


Durch den DAG in Abbildung 2.4 ist die Menge der lokalen bedingten Unab- 
hängigkeiten wie folgt festgelegt: 
(K 1 A,S|®),(A L K|@)}. 


2.4.4 d-Separation 


In Definition 2.10 aus Kapitel 2.4.3 wurde gezeigt, dass durch den Graphen 
G = (V,E) eines Bayes-Netzes die Menge lokaler bedingter Unabhängigkei- 
ten I,(G) gegeben ist. 


Darüber hinaus kann ein Graph weitere, sogenannte globale Markovunabhän- 
gigkeiten enthalten. Diese lassen sich mittels des Konzeptes der d-Separation 
prüfen [Gei90]. Dieses Konzept kann genutzt werden, um zu überprüfen ob 
zwei Mengen an Zufallsvariablen gegeben einer Menge anderer Zufallsvaria- 
blen unabhängig von einander sind. 


Um dieses Konzept herzuleiten wird zunächst der Begriff des (aktiven) Weges 
definiert, vgl. [Gei90] und [Kol09]: 


* Hinweis: Eine detaillierte Darstellung dieses Beispiels findet sich auch in der einschlägigen 
Literatur [Kol09, Kor10, Pea88]. 


28 


2.4 Bayes-Netze als Komponente zur Problemlösung 


Definition 2.11. Gegeben sei der Graph G = (V, €) eines Bayes-Netzes mit 
Zufallsvariablen DR Weiterhin sei Z eine Teilmenge der Zufallsvariablen, 
die beobachtet wurde. Z sei durch dieKnotenmenge Vz GC V repräsentiert. Ein 
Weg ist eine Sequenz von Kanten, die in der ungerichteten Repräsentation des 
DAGs G = (V, E) einen Pfad (Sequenz von Knoten) bildet'. Hierfür schreibt 
man auch Ug = + = U, Mit Ug,...,Um E V. 


Ein solcher Weg wird als aktiver Weg gegeben 2 bezeichnet, falls: 


1. Für jede existierende konvergierende Verbindung v;_; > Vi = Vi+1 
innerhalb des Weges, liegen entweder v; oder einer seiner Nachfolger 
in Vz. 


2. Kein anderer Knoten des Weges liegt in Vz. 


Insbesondere ist der Weg Vo = ++ = Vm nicht aktiv, wenn Ug oder Vm in Vz 
liegen. 


Mithilfe der Definition eines aktiven Weges kann das Konzept der d- 
Separation definiert werden[Gei90]: 


Definition 2.12. Seien W, Y und Z drei disjunkte Teilmengen der Zufalls- 
variablen, die in der Struktur G = (V, €) eines Bayes-Netzes durch die dis- 
junkten Knotenmengen V”, VI und VŽ repräsentiert werden. Dann heißt W 
d-separiert von Y gegeben Z genau dann, wenn es keinen aktiven Weg zwi- 
schen beliebigen Knoten v” € V” und v? € V’ gibt, gegeben VŽ. 


Mit dem Konzept der d-Separation können die globalen Markovunabhängig- 
keiten beschrieben werden. 


* Hinweis: Die Begriffe Weg und Pfad werden in der deutschsprachigen Literatur teils synonym 
verwendet. Hier sind die Übersetzungen der Begriffe trail (= Sequenz von Kanten) und path (= 
Sequenz von Knoten) gemeint, die sich unterscheiden. 
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Definition 2.13. Sei G der DAG eines Bayes-Netzes und W, Y und 2 dis- 
junkte Teilmengen der durch die Knoten des DAG repräsentierten Zufallsva- 
riablen. Dann sind die globalen Markovunabhängigkeiten von G definiert als: 


I(G) ={(W L Y|Z) : W ist d-separiert von Y gegeben 2.} (2.7) 
Für das Beispiel in Abbildung 2.4 sind somit die globalen Markovunabhängig- 
keiten gegeben durch: 


I(6) = {ŒE 1 A,K,SIN)}. 


2.4.5 Dynamische Aspekte 


Ein BN ist ein probabilistisches graphisches Modell (PGM), das graphentheo- 
retische Ansätze mit Ansätzen der Wahrscheinlichkeitstheorie verbindet. Wie 
in Kapitel 2.4.3 ausführlich erläutert, ist ein BN über den Zufallsvariablen 
X:n = Xo X, gegeben durch ein Paar 


—0: 

B=(G,P). (2.8) 
Dabei ist G ein gerichteter, azyklischer Graph 

G =(V,€) (2.9) 


und 


PX.) = [PE Pax) (2.10) 
i=0 


die gemeinsame Wahrscheinlichkeitsverteilung [Kol09]. 


Der Graph G wird genutzt, um Abhangigkeiten zwischen den Zufallsvariablen 
zu definieren und repräsentiert damit die Struktur des BN (vgl. Kapitel 2.4.3). 
Die Vertexmenge V repräsentiert die Menge der Zufallsvariablen, während 
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Abbildung 2.5: Graph eines Bayes-Netzes (BN) über den Zufallsvariablen X .,. Diese Struk- 
tur, die auch Naive BN genannt wird, ist gekennzeichnet durch gerichte- 
te Kanten ausgehend von Wurzelknoten X, zu seinen Kindern X,.,. Da 
eine fehlende Kante die Unabhängigkeit zweier Zufallsvariablen verkörpert, 
kann die Verbundwahrscheinlichkeit P(X). 4) wie folgt faktorisiert werden: 


PX.) = PA DPA IX PEIX PAIX PA, 


eine gerichtete Kante v; > vj der Menge der Kanten € eine direkte Abhän- 
gigkeit zwischen zwei Variablen darstellt. Eine fehlende Kante symbolisiert 
die Unabhängigkeit dieser beiden Variablen (cf. Figure 2.5). 


Die gemeinsame Wahrscheinlichkeitsverteilung repräsentiert die Parameter 
des BN (vgl. Kapitel 2.4.3) und ist durch das Produkt aller bedingten Wahr- 
scheinlichkeitsverteilungen gegeben, die mit den Vertices von G verknüpft 
sind. Dabei bezeichnet Pa(X D die Menge der Eltern einer Zufallsvariablen X. 


Ein Dynamisches Bayes-Netz (DBN) ist eine Erweiterung eines BN, das auch 
die zeitlichen Abhängigkeiten der Zufallsvariablen berücksichtigen kann 
[Mur02]. Ein DBN ist dabei gegeben durch das Tupel 


DBN = (Bp, B). 


Ersteres, also By, wird genutzt, um die Struktur als auch die a-priore Wahr- 
scheinlichkeitsverteilung über den Zufallsvariablen Anz in Zeitschritt 0, 
sprich: P(X)» anzugeben. Die Struktur von By kann beispielsweise nach 
Abbildung 2.5 erfolgen - die Variablen tragen dann zusätzlich einen hochge- 
stellten Index des Zeitschritts 0. 
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Abbildung 2.6: Vereinfachte Darstellung eines zeitlichen Bayes-Netzes mit zwei Zeitscheiben. 
Dieses wird im englischsprachigen Raum auch als Temporal Bayesian Network 
(TBN) mit zwei Zeitscheiben oder kurz als 2TBN bezeichnet. Das 2TBN (oder 
auch: B_,) wird als Schablone für nachfolgende Zeitschritte t eingesetzt. Aus 


Gründen der Übersichtlichkeit sind Knoten der Zufallsvariablen X. (71 nicht ab- 


gebildet, denn es existiert in diesem Beispiel keine direkte Abhängigkeit zu 


X Hee Eine solch vereinfachte Darstellung eines 2TBN, also eine Darstellung 


mit nur relevanten Knoten des vorgelagerten Zeitschritts, wird teils als 1,5TBN 
bezeichnet [Mur02]. 


Weiterhin spezifiziert B_, die bedingte Wahrscheinlichkeitsverteilung über 
diskrete Zeitschritte t hinweg, nämlich durch die Verwendung von: 


BO.) = [] PG) Pax). (2.11) 
i=0 


Dabei bezeichnet Pa(X die Menge der Eltern von X i im zugehörigen Gra- 
phen. Eltern können hierin dem selben Zeitschritt t oder aber dem voran- 
gegangenen Zeitschritt t — 1 zugeordnet sein. Im letzteren Falle zeigen ge- 
richteten Kanten in Zeitschritte mit höherem Index, was das zeitliche Voran- 
schreiten widerspiegelt [Mur02]. Abbildung 2.6 zeigt hierzu beispielhaft den 
Graphen B_ eines DBNs. Dabei besitzt der Knoten der Zufallsvariablen X A 
einen Elternknoten im vorgelagerten Zeitschritt t — 1; es existiert also eine 
gerichtete Kante über zwei verschiedene Zeitschritte hinweg. Weiterhin exis- 
tieren Kanten innerhalb eines Zeitschrittes, beispielsweise zwischen Knoten 
der Zufallsvariablen x, undX ie 
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Abbildung 2.7: Die Abbildung zeigt ein über 3 Zeitschritte ausgerolltes DBN. Zur Vereinfachung 
sind einige Knoten nicht dargestellt, was durch --- veranschaulicht wird. 


Die gemeinsame Wahrscheinlichkeitsverteilung über mehrere Zeitschritte 
hinweg ergibt sich als [Mur02]: 


PX) = (i De) H I] PX; |Pa(X;)) (2.12) 
= [| [ [PŒ r&i). (2.13) 
t=0 i=0 


Anschaulich entspricht das einem Ausrollen des DBNs. Hierbei fungiert Bo 
als Startverteilung für Zeitschritt 0 und BJ als Schablone für alle weiteren 
Zeitschritte, vgl. hierzu auch Gleichung (2.12) sowie Abbildung 2.7. Letztere 
zeigt den Graph eines DBN, der mit m = 2 ausgerollt wurde. 
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2.5 FHIR zur Wissensrepräsentation 


Ziel der FHIR’ ist die Unterstützung des Austauschs von Informationen zwi- 
schen Softwaresystemen’ im medizinischen Bereich’. Herausgeber ist die He- 
alth Level Seven (HL7)* International, welche im Jahr 1987 als non-Profit Or- 
ganisation gegründet wurde und durch das American National Standards In- 
stitute (ANSI) seit 27 Jahren als Normungsorgan akkreditiert ist. Gemeinsam 
mit der ISO und anderen Normungsorganen werden kontinuierlich interna- 
tional einschlägige Normen etabliert. 


Mit FHIR können sowohl Ressourcen als auch Datenformate und Schnittstel- 
len spezifiziert werden [Ben21]. Ressourcen sind allerdings die zentralen Bau- 
steine der FHIR [Oem21]. Aus diesen allgemeinen Schablonen können do- 
mänentypische Objekte wie beispielsweise Patient (engl. Patient), Untersu- 
chungswert (engl. Observation) oder Behandlungsort (engl. Location) abge- 
leitet werden. Es stehen 145 verschiedene Ressourcen zur Verfügung [FHI21], 
die sich gemäß ihres Typus in einer Taxonomie verorten lassen [Ben21]. Mit 
Berücksichtigung der entsprechenden fachlichen Sicht ergibt sich Tabelle 2.2 
auf Seite 36 mit den jeweils beispielhaft dargestellten Ressourcen. 


Weitere Ressourcen können nach Bedarf hinzugefügt werden [Ben21]. Insge- 
samt können so Daten mittels FHIR auffindbar (engl. Findable), zugänglich 


n 


Gesprochen: ['farə] (engl. fire). 
Hinweis: Systeme werden in der Begriffswelt der Softwaretechnik als Ausschnitte der realen 


Y 


oder gedanklichen Welt gesehen, welche aus Komponenten, darauf vorhandenen Strukturen 
sowie einer Systemgrenze bestehen [Hes84, Bal10]. Letztere wird auch als Schnittstelle oder 
seltener als Nahtstelle bezeichnet (engl. interface). 

Hinweis: Der Anwendungsbereich umfasst Human- und Veterinärmedizin und hierin die me- 
dizinische Versorgung selbst als auch Finanz- und Verwaltungsaspekte[Ben21, FHI21]. 
Hinweis: Die Zahl 7 ist eine Anspielung auf das Open Systems Interconnection (OSI) Schichten- 
modell der International Organization for Standardization (ISO) - häufig kurz als ISO/OSI Mo- 
dell bezeichnet [Pro93]. Dieses bezieht sich auf die Verbindung (Interconnection) verschiedener 
Systeme. Hierin ist die Schicht 7 die sog. Anwendungsschicht, welche sich mit dem Austausch 
von Daten auf Anwendungsebene beschäftigt. 


w 


e 
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(engl. Accessible), interoperabel (engl. Interoperable) sowie wiederverwend- 
bar (engl. Reusable) genutzt werden - also sprich: nach dem sogenannten 
FAIR-Prinzip [Wil16, Thu21]. 


2.5.1 Motivation 


FHIR gewann in den letzten Jahren zunehmend an Bedeutung [Leh19a, 
Hub20]. Schon im Jahr 2018 verstandigten sich die Technologieunternehmen 
IBM, Microsoft, Oracle, Google, Amazon und Salesforce in einer gemein- 
samen Erklärung auf die Notwendigkeit bestehende Hemmnisse bei der 
medizinischen Datenrepräsentation zu beseitigen. Hierin werden FHIR und 
angeschlossene Projekte bereits explizit genannt [Inf18, Leh19a], denn sie 
sollen es ermöglichen, medizinische Daten mit Methoden der KI weltweit 
sowie unternehmensübergreifend effektiv und effizient nutzen zu können 


[Leh19b]. 


Mittlerweile wurden auf Basis dieser Bestrebungen Googles Cloud Healthcare 
API [Goo21] und Microsofts Azure API FHIR [Mic21] als Dienste zur Analyse 
großer medizinischer Datenbestände realisiert [Hub20]. Bei letzterem Dienst 
werden in regelmäßigen Abständen Fallbeispiele der Nutzer dieses Dienstes 
aus dem universitären und unternehmerischen Bereich veröffentlicht [Mic21]. 


Im Bereich der Software für Patienten nutzt das Unternehmen Apple im Zuge 
der Verknüpfung von elektronischen Gesundheitsdaten mit der eigenen He- 
alth App die FHIR Technologie beispielsweise für die Repräsentation von All- 
ergien, Impfungen, Medikamenten und Vitalwerten [App21]. Solcherlei Um- 
setzungen mit FHIR werden auch allgemeiner betrieben. Zum Beispiel mit 
den Substitutable Medical Applications Reusable Technologies (SMART), die 
einen Einstiegspunkt für die Entwicklung von Gesundheitsanwendungen bie- 
ten [Man16] und die aus der Zusammenarbeit zwischen dem Bostoner Child- 
ren’s Hospital und der Harvard Medical School entstanden sind. 


Weiterhin ergab sich speziell in Deutschland die Frage nach akzeptierbaren 
Softwarelösungen im Hinblick auf ePA, deren Entwicklung durch entspre- 
chende Gesetze in den Jahren zuvor angeregt wurden. Im Jahr 2019 stellten 
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Tabelle 2.2: In FHIR stehen mit Version 4 R4 insgesamt 145 verschiedene Ressourcen zur Ver- 
fügung [FHI21]. Dieses lassen sich gemäß ihres Typus in einer Taxonomie verorten 
[Ben21], die sich auf fachliche Sichten herunterbrechen lässt. Die erste Spalte der 
Tabelle zeigt die fachlichen Sichten und jeweils eine beispielhaft dargestellte Res- 
source in der zweiten Spalte. Es existiert ein große Bandbreite an Sichten und somit 
auch an zugeordneten Ressourcen. 


Sicht Beispielressource 
Arzneimittel Medication 
Bildgebung ImagingStudy 
Biomedizinische Forschung Researchstudy 
FHIR Infrastruktur Resource 

Finanzen Invoice 
Gemeinschaftliche Pflege Consent 

Klinische Genomik MolecularSequence 
Klinische Qualitätsinformationen MeasureReport 
Medizinische 

Entscheidungsunterstützung PlanDefinition 
Medizinische Geräte DeviceMetric 
Nachrichtenaustausch MessageDefinition 
Öffentliche Gesundheit Immunization 
Patientenversorgung Goal 
Patientenverwaltung Patient 

Sicherheit Provenance 
Strukturdokumente DocumentManifest 
Verordnungen Substance 
Vokabular ValueSet 
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hierzu [Plo19] ein Konzept vor, welches FHIR nutzt, um durch eine möglichst 
akzeptierbare Lösung eine hohe Akzeptanz bei den Benutzern zu erreichen. 
Heute, im Jahr 2022, basieren Schnittstellen sowie die auf der ePA ablegbaren 
und in Bearbeitung befindlichen MIO wie beispielsweise Impfpass, Mutter- 
pass oder das Zahnärztliche Bonusheft auf FHIR [Kas21]. 


2.5.2 Hierarchie der Ressourcen und Elemente 


Neben Ressourcen existieren in FHIR sogenannte Elemente, welche zum Be- 
füllen der Ressourcen dienen. Elemente sind beispielsweise primitive Daten- 
typen (Ganzzahl integer, Zeichenkette string etc.) oder auch spezielle Daten- 
typen (Postadresse Address, Alter Age etc.). Bei ersteren kann direkt der Da- 
tentyp mitsamt Wert und Bezeichner festgelegt werden (z. B. Datentyp integer 
mit Wert 3 und Bezeichner anzahlKinder). Bei letzterem sind je nach Datentyp 
weitere Klassen für die Spezifikation von Werten und Bezeichnern notwendig. 


Gemeinsame Basis von Elementen als auch von Ressourcen in FHIR ist 
aber ein abstraktes (engl. abstract) Wurzelelement, von dem ausgehend sich 
zwei inhaltlich verschiedene Hierarchien aufspannen [Oem21]. Abbildung 
2.8 zeigt ein stark vereinfachtes Klassendiagramm zur Verdeutlichung der 
groben Zusammenhänge am prototypischen Beispiel der Ressource Patient 
und den wichtigsten Datentypen. 


Weiße Pfeilspitzen in Abbildung 2.8 zeigen (wie bei Klassendiagrammen üb- 
lich) Vererbungen an, wobei der jeweilige Pfeil von der Spezialisierung hin 
zur Generalisierung zeigt. Die schwarze Raute repräsentiert eine Komposi- 
tion, also eine Teil-Ganze Beziehung bei der das Teil nicht ohne das Gan- 
ze existieren kann. Kardinalitäten, also Kann- bzw. Mussbeziehungen, sind 
in eckigen Klammern angegeben und beschränken sich in dem dargestellten 
Ausschnitt auf einfache Kannbeziehungen [0..1] oder mehrfache Kannbezie- 
hungen [0.. *]. 


Auf der rechten Seite in Abbildung 2.8 befinden sich u.a. die von einem abs- 
trakten Element abgeleiteten primitiven Datentypen (beispielsweise Ganz- 
zahl) und allgemeine Datentypen (beispielsweise Adresse). In letzterem lassen 
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Base {abstract} 


— 


Resource 


id: id [0..1] 
language: code [0..1] 


Element {abstract} 


id: id [0..1] 


extension: Extension [0..*] 


contained 


DomainResource 


text: Narrative [0..1] 
extension: Extension [0..*] 


Patient 


gender: code [0..1] 
name: HumanName [0..*] 


A 


— PrimitiveDataType 
= GeneralPurposeDataType 


Abbildung 2.8: Die Abbildung zeigt ein Klassendiagramm zur Verdeutlichung der Zusammen- 
hänge am Beispiel der FHIR Ressource Patient (links) und den wichtigsten 
Datentypen (rechts) [FHI21, Oem21]. Zur Vereinfachung sind einige Klassen 
und Zusammenhänge nicht dargestellt, was durch das Symbol --- veranschau- 
licht wird. Die getrennten Hierarchien erlauben eine flexible Modellierung der 
Ressourcen- bzw. Elementaspekte, was als Anlehnung an die aus der Software- 
entwicklung als Entwurfsmuster „Brücke“ bekannten Herangehensweise gese- 
hen werden kann. Das gemeinsame Wurzelelement Base dient zur Etablierung 
gemeinsamer Eigenschaften die dann sowohl bei Elementen als auch Ressour- 
cen immer vorhanden sein müssen. 


sich auch umfangreiche Vokabularien verknüpfen, sodass sich Logical Obser- 


vation Identifiers Names and Codes (LOINC) oder Systematized Nomencla- 
ture of Medicine (SNOMED) in einfacher und konsistenter Weise einbinden 


lassen. 
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Auf der linken Seite in Abbildung 2.8 sind die Ressourcen verortet. Konkret 
wird zunächst die Klasse Resource abgeleitet, von der wiederum die Klasse 
der sogenannten DomainResource spezialisiert wird. Diese zusätzliche Abs- 
traktionsebene ermöglicht es, in einer DomainResource mehrere Ressourcen 
zu verankern (engl. contained). Weiterhin lassen sich durch diese zusätzli- 
che Abstraktionsebene flexibel Erweiterungen (engl. Extensions) einbinden. 
Spezialisierungen der DomainResource sind dann beispielsweise Patient oder 
eine der anderen 145 Ressourcen (vgl. Symbole --- rechts neben Patient in Ab- 
bildung 2.8). Die Ressourcen selbst stehen typischerweise auch in Beziehung 
zueinander, so kann ein Patient mehrere behandelnde Ärzte haben, die selbst 
auch Ressourcen im FHIR’schen Sinne sind. 


2.5.3 Medizinische Entscheidungsunterstützung 


Für die nachfolgenden Betrachtungen ist aus den unterschiedlichen Sichten 
(vgl. Tabelle 2.2 auf Seite 36) die Sicht der medizinischen Entscheidungsun- 
terstützung von besonderer Bedeutung. Hierin sind Ressourcen wie PlanDe- 
finition und Action verortet, die für eine Repräsentation eines Prozessmodells 
notwendig sind. 


Abbildung 2.10 auf Seite 42 zeigt ein Klassendiagramm mit den Klassen Plan- 
Definition, Action und RelatedAction. Zur besseren Übersichtlichkeit wurden 
optionale Attribute und Verbindungen zu anderen Klassen vernachlässigt. 
Zentrales Element ist die Action, welche den Baustein einer PlanDefinition 
bildet. Diese Teil-Ganze Beziehung zwischen PlanDefinition und Action wird 
durch die Komposition (schwarze Raute) gekennzeichnet. Eine PlanDefinition 
kann ihrerseits aus beliebig vielen Instanzen einer Action bestehen, was durch 
die mehrfache Kannbeziehung [0.. *] angegeben wird. 


Eine Action kann wiederum mit beliebig vielen (related-)Actions in Beziehung 
stehen. Hierfür muss die Action jeweils die id der Zielaktion der Beziehung 
kennen. Eine solche Beziehung kann neben der expliziten Darstellung über ei- 
ne solche id auch durch eine gerichtete Kante angegeben werden. Die gerich- 
tete Kante zeigt dann von der betrachteten Action zur in Beziehung stehenden 
Action. Das bedeutet, es kann von der Quell- zur Zielaktion navigiert werden. 
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Abbildung 2.9 zeigt die Zusammenhänge an einem Beispiel, in dem jeweils 
eine zeitliche Beziehungen (relationship=before-end) zwischen Aktion a und 
Aktion b zu einer anonymen Aktion besteht!. Zur Übersichtlichkeit wurde an 
den beiden Kanten in der Abbildung 2.9 auf die Attributnamen relationship 
verzichtet und nur deren Ausprägungen dargestellt. 


Im rechten Teil des Klassendiagramms in Abbildung 2.10 auf Seite 42 zeigt 
sich eine reflexive Komposition. Diese gibt an, dass eine Action aus beliebig 
vielen weiteren Actions bestehen kann (aber nicht muss). Diese Beziehungen 
in Kombination mit zwei Attributen, dem sogenannten groupingBehavior und 
dem sogenannten selectionBehavior, ermöglichen, dass beispielsweise nur ei- 
nes der Kinder ausgeführt werden kann (groupingBehavior = logical-group, 
selectionBehavior = exactly-one), höchstens eines der Kinder ausgeführt wer- 
den kann (groupingBehavior = logical-group, selectionBehavior = at-most-one) 
oder alle Kinder in beliebiger Reihenfolge ausgeführt werden müssen (grou- 
pingBehavior = logical-group, selectionBehavior = all). Diese Festlegungen sind 
für Verschaltungen von Actions wichtig?. 


Abbildung 2.9 zeigt beispielhaft wie die Aktionen a und b selektiv ausgeführt 
werden. In gleicher Weise führt das Setzen einer selectionBehavior mit dem 
Wert all oder aber at-most-one zu entsprechend anderem Verhalten. Die Kin- 
derknoten können dabei selbst Beziehungen zu weiteren Aktionen aufweisen 
oder auch Elternknoten sein. 


Ein weiteres Attribut einer Action ist das sogenannte cardinalityBehavior. 
Hierdurch wird festgelegt, ob eine Aktion nur einmalig ausgeführt werden 
kann (cardinalityBehavior = single) oder eine mehrfache Ausführung der 


n 


Hinweis: Die Abbildung zeigt ein Objektdiagramm. D.h. im Gegensatz zu einem Klassendia- 
gramm werden nicht Klassen, sondern konkrete Objekte (also Instanzen von Klassen) und ihre 
Beziehungen zueinander angegeben. Im vorliegenden Fall werden somit die Objekte a und b 
angegeben, welche Instanzen der Klasse Action sind. Dieser Sachverhalt wird mit a:Action bzw. 
b:Action ausgedrückt. Vereinfachend formuliert handelt es sich bei a und b um Aktionen - oder 


genauer: um Instanzen der Klasse Action. Instanzen ohne Namen (anonyme Objekte) werden 
mit :Action angegeben. 

Die verschiedenen Arten möglicher Verschaltungen werden im folgenden Kapitel 3 (Prozess- 
modelle) ab Seite 47 näher beleuchtet. 


Y 
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„Action 


groupingBehavior=logical-group 
selectionBehavior=exactly-one 
cardinalityBehavior=single 


N 
| before-end 


a:Action 


before-end 


b:Action 


Abbildung 2.9: Die Abbildung zeigt die zwei Aktionen a, b. Hierbei werden a und b selektiv 
ausgeführt - d. h. entweder Aktion a oder aber Aktion b werden ausgeführt. Ein 
Knoten des Typs Action bündelt die Entscheidung (groupingBehavior=logical- 
group) über das Attribut selectionBehavior=exactly-one. Die verbundenen Kind- 
knoten a und b, von denen nur exakt einer ausgeführt werden kann, müssen 
beendet sein (groupingBehavior=before-end) bevor die Elternaktion endet und 
mithin die Ausführung andere Aktion beginnen kann. Eine merfache Ausfüh- 
rung des Elternknotens ist ausgeschlossen (cardinalityBehavior=single) 


Aktion möglich ist (cardinalityBehavior = multiple). In Abbildung 2.9 wird 
eine einmalige Ausführung der Entscheidung festgelegt. 


Gedanklich zurückkehrend auf das Klassendiagramm in Abbildung 2.10 (Seite 
42), kann eine Action auch einen (Daten-)input sowie einen (Daten-)output 


aufweisen. 


Letztgenannte sind von der Klasse DataRequirement, deren Typ spezifiziert 
werden muss und vom speziellen Datentypen Observation stammen kann. Der 
Datentyp Observation wird in FHIR verwendet, um Messwerte und einfache 
Angaben unter anderem über Patienten, Geräte, etc. festzuhalten. 
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Abbildung 2.10: Die Abbildung zeigt Zusammenhänge zwischen den Klassen PlanDefinition, 
Action und RelatedAction in einem Klassendiagramm. Eine PlanDefinition be- 
steht aus beliebig vielen Actions. Umgekehrt besteht also eine Teil-Ganze- 
Beziehung (schwarze Raute), wobei das Ganze die PlanDefinition darstellt und 
die Teile die einzelnen Actions. Eine Action kann aus beliebig vielen weiteren 
Actions bestehen. Zusätzlich kann jede Action zu beliebig vielen anderen Ac- 
tions in Beziehung stehen sowie beliebig viele Ein- und Ausgaben vom Typ Da- 
taRequirement aufweisen. Letzterer wurde um einen optionalen Dezimalwert 
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PlanDefinition 


Condition 


status: code [1..1] 


kind: code [1..1] 
expression: Expression [0..1] 


condition [0..*] 


action [0..*] 


input [0..*] 


dl 
+ 


output [0..*] 


DataRequirement 


> type: code [1..1] 


Action 


id: id [0..1] 

groupingBehavior: code [0..1] 
selectionBehavior: code [0..1] 
cardinalityBehavior: code [0..1] 
transition: decimal [0..1] 
timingDuration: Duration [0..1] 


probObs [0..1] 


relatedAction [0..*] 


action [0..* 


Extension 


RelatedAction 


value: decimal [0..1] 


actionld: id [1..1] 
relationship: code [1..1] 


CodeableConcept 


subjectCodeableConcept [0..1] 


text: string [0..1] 


coding [0..*] 


Coding 


system: uri [0..1] 
code: code [0..1] 


display: string [0..1] 


probObs erweitert und steht mit CodeableConcept und Coding in Verbindung. 


2.5 FHIR zur Wissensrepräsentation 


Um darüber hinaus Wahrscheinlichkeitswerte mit einem DataRequirement as- 
soziieren zu können, wurde eine Erweiterung (Extension) eingeführt, die einen 
solchen Wert als Dezimalzahl (decimal) aufnimmt". Vgl. hierzu Abbildung 2.10 
mittig, links. 


Gegenstand (engl. subject) des DataRequirements ist ein sogenanntes Codeab- 
leConcept. Referenziert wird letzteres über den Namen subjectCodableConcept. 
Dabei handelt es sich um einen Datentyp, der aus einem beschreibenden Frei- 
text (text), sowie einem oder mehreren Codings besteht. 


Ein Coding bezieht sich seinerseits auf ein Codesystem (system), welches ei- 
ne Menge möglicher codes definiert. Beispiele für ein solches Codesystem 
sind medizinische Nomenklaturen wie LOINC und SNOMED. Durch einzelne 
Codes sind hier beispielsweise medizinische Werkzeuge, Untersuchungswerte 
und Diagnosen referenzierbar. Dies erleichtert den Austausch des gemeinsam 
mit dem Experten formalisierten Wissens durch eine eindeutige und etablierte 
Begriffszuordnung. 


Für einen optionalen (Daten-)input sowie einen (Daten-)output einer Action 
können also mittels CodeableConcept beliebig viele solcher Coding-Instanzen 
hinterlegt werden, für die jeweils das System (system), der Code (code) sowie 
ein beschreibender Text (display) angegeben werden können. 


Abbildung 2.11 zeigt ein Objektdiagramm, bei dem ein DataRequirement als 
Output einer Aktion spezifiziert wurde. Das DataRequirement ist vom Typ 
Observation und trägt den Wahrscheinlichkeitswert probObs.value = 0.8. 


Darüber hinaus ist dem DataRequirement ein subjectCodeableConcept mit 
dem beschreibenden Freitext text=Trokar zugewiesen. Für dieses subject- 
CodeableConcept wurde weiterhin ein coding hinterlegt. Das coding ist 
aus dem System SNOMDED CT (system=SNOMED CT), trägt den Code 
118418003 (code=118418003) und verfügt über die Bezeichnung Trocar device 
(display=Trocar device). 


* Hinweis: Die Erweiterung wurde zur probabilistischen Modellierung von Arbeitsabläufen ei- 
gens erstellt, validiert und den FHIR-Interessensgruppen unter dem folgenden Link zur Verfü- 
gung gestellt: https://simplifier.net/probabilisticdm/probobservation/$validate. 
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a:Action 


output[0] 


:DataRequirement 


type=Observation 

probObs.value=0.8 

subjectCodeableConcept.text=Trokar 
subjectCodeableConcept.coding[0].system=SNOMED CT 
subjectCodeableConcept.coding[0].code=118418003 
subjectCodeableConcept.coding[0].display=Trocar device 


Abbildung 2.11: Die Abbildung zeigt ein Objektdiagramm mit einer Aktion a der Klasse Ac- 


tion, der als output[0] das Objekt der Klasse Datarequirement zugewiesen wur- 
de. Hinweis: Aus Gründen der Übersichtlichkeit werden alle weiteren Objek- 
te als Attribute in output[0] dargestellt und nicht separat mit Kante und Ob- 
jektkasten visualisiert. Das Objekt output[0] trägt den Typ Observation (ty- 
pe=Observation). Weiterhin weist das Objekt einen Wahrscheinlichkeitswert 
von 0.8 auf, der wiederum aus dem Objekt probObs der Klasse Extension stammt 
und dort unter dem Attributnamen value bekannt ist. Darüber hinaus hat das 
Datarequirement output[0] ein subjectCodeableConcept mit dem beschreiben- 
den Attribut text=Trokar. Für dieses subjectCodeableConcept wurde ein be- 
stimmtes coding aus SNOMED CT hinterlegt (system=SNOMED CT). Der Code 
lautet 118418003 (code=118418003) und wird für den Menschen lesbar mit der 
Bezeichnung Trocar device angegeben (display=Trocar device). 


In ähnlicher Weise lassen sich einer Aktion Bedingungen (engl. conditions) 


und eine Dauer (engl. duration) zuweisen. 


Abbildung 2.12 zeigt wie für eine Aktion eine Bedingung condition[0] der 
Klasse Condition festgelegt ist. Die Art (engl. kind) der Bedingung betrifft die 
Anwendbarkeit der entsprechenden Aktion (kind=applicability), sprich: wann 


diese Aktion ausgeführt werden soll. Hierfür ist in der Bedingung wiederum 


ein Ausdruck (engl. expression) hinterlegt. Für diesen kann die Sprache (engl. 


language) und der eigentliche Ausdruck angegeben werden. Im vorliegenden 


Falle ist expression.language=text/cql.identifier und expression.expression=x>0 


44 


2.5 FHIR zur Wissensrepräsentation 


condition[O] u 
a:Action : Condition 


kind=applicability 
expression.language=text/cql.identifier 
expression.expression=x>0 


timingDuration 


:Duration 


value=10 
unit=sec 


Abbildung 2.12: Die Abbildung zeigt ein Objektdiagramm mit Aktion a der Klasse Action sowie 
zwei zugeordnete Objekte. Das Objekt im oberen Teil der Abbildung ist aus der 
Klasse Condition (engl. Bedingung) und beherbergt deren Art (engl. kind) also 
auch einen zugeordneten Ausdruck (engl. expression). Für den Ausdruck ist die 
Sprache (engl. language) als auch der Ausdruck selbst hinterlegt. Die konkreten 
Ausprägungen der Attribute lassen sich wie schon gewohnt (vgl. Beschreibung 
Abbildung 2.11) dem Objektdiagramm entnehmen. 


gewählt worden. Zusätzlich weist die gezeigte Aktion ein Dauer (engl Dura- 
tion) auf '. Sie beträgt in diesem Falle 10 Sekunden. 


* Hinweis: Die in Abbildung 2.12 gezeigten Eigenschaften können unabhängig voneinander ge- 
setzt werden und wurden nur zur Verdichtung von Text und Abbildungen in ein gemeinsames 
Schaubild zusammengefasst. 
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Prozessmodelle und weitere Begrifflichkeiten werden in Kapitel 3.1 bespro- 
chen. In Kapitel 3.2 und 3.3 werden die Grundlagen der Petri-Netze und UML 
Aktivitäten dargestellt. Diese Grundlagen sind die Basis für weitergehende 
Betrachtungen in den nachfolgenden Teilen der vorliegenden Arbeit. 


3.1 Begrifflichkeiten 


Die Begriffe Prozess, Workflow, und Arbeitsablauf werden, auch in der medi- 
zinischen Domäne, unterschiedlich verwandt. Es findet sich also in der Lite- 
ratur keine allgemeingültige Definition. 


3.1.1 Prozess 


Ein Geschäftsprozess ist gemäß [Wor99] folgendermaßen definiert’: 


„Eine Menge von einem oder mehreren verknüpften Abläufen oder Aktivitäten, 
die gemeinsam ein Geschäftsziel oder Strategieziel realisieren, normalerweise im 
Kontext einer Organisationsstruktur, die funktionale Rollen und Beziehungen 
definiert.“ 


Eine weitere Definition eines Prozesses für den Bereich der Medizin findet sich 
in [Neu12]. Hier wird der Begriff eines chirurgischen Prozesses in Anlehnung 


1 Hinweis: Deutsche Übersetzung der originalen Definition: A set of one or more linked procedu- 
res or activities which collectively realise a business objective or policy goal, normally within 
the context of an organisational structure defining functional roles and relationships. 
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an die Definition nach [Wor99] beschrieben. Wobei das Geschäftsziel ersetzt 
wird durch ein sogenanntes chirurgisches Ziel. Allgemeiner zu [Wor99] wird 
durch [Vos96] der Begriff Prozess definiert als: 


„Inhaltlich abgeschlossene, zeitlich und sachlogische Abfolge der Funktionen, die 
zur Bearbeitung eines betriebswirtschaftlich relevanten Objektes notwendig ist.“ 


Interessanterweise findet sich eine ähnliche Definition im Bereich der Medi- 
zin, hier allerdings für den Begriff des Workflows [Har19]: 


„Ein Workflow ist eine inhaltlich abgeschlossene, zeitlich und sachlogisch zu- 
sammenhängende Kette von Funktionen oder Diensten, die zur Bearbeitung einer 
betriebswirtschaftlich relevanten Entität notwendig sind [..]* 


Diese Definition deckt sich wiederum mit der nicht-medizinischen Sichtweise 
aus [Miih12]. 


3.1.2 Workflow 


Nach [Aal13] liegt der Fokus bei der Workflowmodellierung bei der Automa- 
tisierung von Teilen eines (Geschäfts-)Prozesses. Workflows seien somit tech- 
nisch motiviert und beschrieben im Gegensatz zu Prozessen weniger das Zu- 
sammenwirken von Personen oder den (realweltlichen) Ablauf der Gescheh- 
nisse. Diese Sichtweise wird weitestgehend gestützt von [Wor99, Wes12]. Die- 
se definieren den Begriff Workflow wie folgt': 


„Die ganze oder teilweise Automatisierung eines Geschäftsprozesses, während 
der Dokumente Informationen oder Aufgaben gemäß einer Menge von Prozess- 
regeln von einem Beteiligten an einen anderen weitergereicht werden.“ 


In diesem Kontext wird der Begriff Workflow teils mit dem deutschen Begriff 
der Ablaufsteuerung und nicht mit Begriff Arbeitsablauf übersetzt [Kre99]. 
Was im Hinblick auf die Definition und der Betonung einer Automatisierung 


1 Hinweis: Deutsche Übersetzung der originalen Definition: The automation of a business pro- 
cess, in whole or part, during which documents, information or tasks are passed from one 
participant to another for action, according to a set of procedural rules. 


48 


3.1 Begrifflichkeiten 


durchaus als sinnvoll erscheint. Hier bettet sich auch die Definition eines 
Workflows nach [Dum13] ein, der den Begriff Workflow gleichsetzt mit dem 
Begriff des automatisierten Geschäftsprozess und dabei die weitestgehend be- 
deutungsgleiche Definition nach [Wor99] widerspiegelt’. 


3.1.3 Arbeitsablauf 


Der deutsche Begriff Arbeitsablauf (engl. Work Process [ISO16]) findet im Be- 
reich der Arbeitswissenschaften Anwendung. Beispielsweise ist ein Arbeits- 
ablauf nach DIN EN ISO 6385 [DIN16] definiert als eine „räumliche und zeit- 
liche Abfolge des Zusammenwirkens von Arbeitenden, Arbeitsmitteln, Mate- 
rialien Energie und Information innerhalb eines Arbeitssystems“. Wobei ver- 
einfachend? gilt [DIN16]: 


e Arbeitende sind Personen innerhalb des Arbeitssystems, die ein oder 
mehrere Tätigkeiten zur Erreichung eines Ziels durchführen 


e Arbeitsmittel sind Werkzeuge [..] und andere im Arbeitssystem benutz- 
te Komponenten 


e Arbeitssystem ist ein System, welches das Zusammenwirken eines ein- 
zelnen oder mehrerer Arbeitender mit den Arbeitsmitteln umfasst [..] 
um die Funktion des Systems [..] unter den durch die Arbeitsaufgaben 
vorgegebenen Bedingungen zu erfüllen 


Eine weitestgehend bedeutungsgleiche Definition findet sich in [REF15]. Die- 
se Definitionen beinhalten nicht den Aspekt der Automatisierung und las- 
sen sich somit der häufig verwandten englischen Begriff des Workflows nur 
unzureichend zur Deckung bringen. Vielmehr weisen die Definition stärkere 
Ähnlichkeiten zum Begriff des Prozesses auf, was angesichts der englischen 


Hinweis: Deutsche Übersetzung der originalen Literaturstelle: In this context, we will refer to 
an automated business process, also known as workflow: a process that is automated in whole 
or in part by a software system, which passes information from one participant to another for 
action, according to the temporal and logical dependencies set in the underlying process model. 
Hinweis: Eine ausführliche Auflistung weiterer Begrifflichkeiten und deren Zusammenhänge 
findet sich in [DIN16]. 


» 
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Übersetzung des Arbeitsablaufs als sogenannten Work Process [ISO16] sinnig 
erscheint. Die Begrifflichkeiten der Normen [DIN16, ISO16] betten sich dabei 
kompatibel zum Bereich der Gebrauchstauglichkeit [DIN99] und verwandter 
Normen ein, vgl. [Phil5a]. 


3.1.4 Definitionen 


In dieser Ausarbeitung wird der Begriff Arbeitsablauf für die arbeitswissen- 
schaftliche Betrachtung medizinischer Prozesse im Hinblick auf die Quellen 
[DIN16, ISO16, REF15] genutzt; falls notwendig wird die englische Überset- 
zung Work Process verwendet. Weiterhin wird in Anlehnung an [Wor99, 
Neu12] definiert: 


Definition 3.1. Ein medizinischer Prozess ist eine Menge von einem oder 
mehreren verknüpften Abläufen oder Aktivitäten, die gemeinsam ein medizi- 
nisches Ziel realisieren, üblicherweise im Kontext einer Organisationsstruk- 
tur, die funktionale Rollen und Beziehungen definiert. 


Der Begriff des Workflows wird in Bezug zur Automatisierung von Teilen ei- 
nes medizinischen Prozesses verwendet und als Ablaufsteuerung (engl. Work- 
flow) bezeichnet. 


Weitergehend werden in Anlehnung an [Wor99, Neu09, Dum13] drei Ebenen 
der Begrifflichkeiten definiert (vgl. Tabelle 3.1). 


Der Begriff des medizinisches Prozesses bezieht sich auf die (Real-)Welt. Da- 
her wird in dieser Ausarbeitung die Durchführung eines tatsächlichen medi- 
zinischen Prozesses als medizinischen Prozess bezeichnet (in Anlehnung an 
[Neu12]). Unter Berücksichtigung der Einschränkungen von Modellen, z.B. 
durch Verkürzung [Fri06, Sta73], wird in dieser Arbeit definiert: 


Definition 3.2. Ein medizinisches Prozessmodell ist ein Abbild eines medi- 
zinischen Prozesses, das einen vordefinierten Interessensausschnitt in einer 
formalen oder semi-formalen Repräsentation widerspiegelt. 
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Tabelle 3.1: Der Begriff medizinischer Prozess in Bezug zu den drei Sichten: Welt, Modell und 
Instanz. Ein (real-)weltlicher Prozess wird durch Modellbildung in ein Modell über- 
führt. Je nach Zweck der Modellbildung kann dies mit mehr oder weniger Verkür- 
zungen einhergehen [Fri06]. Wird ein Modell ausgeführt, also eine konkrete Instanz 
erstellt, so spricht man auch von Instanziierung. 


Sicht Begriff 
Welt med. Prozess 
Modell med. Prozessmodell, 


auch: Prozessdefinition, Prozessschema, Prozess 


Instanz med. Prozessinstanz 
auch: Prozessmodellinstanz, Fall (engl. Case), Szenario, 
Prozess 


Weiterhin gilt für die Instanziierung eines medizinischen Prozessmodells in 
Anlehnung an [Wor99]: 


Definition 3.3. Eine medizinische Prozessinstanz repräsentiert eine einzelne 
Ausführung eines Prozessmodells. 


Als Methapher zur Unterteilung nach Tabelle 3.1 kann ein reales Wegenetz 
herangezogen werden. Das Modell des Wegenetzes kann beispielsweise mit- 
tels eines Graphen mögliche Fahrwege repräsentieren. Die Instanz des Mo- 
dells ist dann ein konkreter Fahrweg innerhalb des Wegenetzes - wobei der 
Raum der Möglichkeiten zur Wegewahl durch das Modell des Wegenetzes vor- 
gegeben wird. Aus diesem Grunde wird teils der Begriff Schema statt Modell 
verwendet’. 


Zur Modellbildung, in Zusammenhang mit Prozessen aus dem geschäftlichen 
Umfeld auch Geschaftsprozessmodellierung (engl. Business Process Mode- 
ling) (BPM) genannt [Wes12], sind gerichtete Graphen das Mittel der Wahl. 


1 Hinweis: Ähnliche Verdeutlichungen sind die Beziehung zwischen Klasse und Objekt in der 
Objektorientierung sowie Entitätstyp und Entität bei der Datenmodellierung 
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Als Stand der Technik gelten in diesem Zusammenhang beispielsweise Ge- 
schäftsprozessmodell und -notation (engl. Business Process Model and Nota- 
tion) (BPMN), Ereignisgesteuerte Prozessketten (EPK), Petri-Netze, UML Ak- 
tivitatsdiagramme und Prozessbäume [Aal13, Aal16]. Die drei Letztgenannten 
werden in den folgenden Kapiteln dargestellt. 


3.2 Petri-Netze 


Der heute unter dem Namen Petri-Netz bekannte Formalismus entstand 
im Jahre 1962 [Pet67]. Damals hatte Carl Adam Petri in seiner Dissertation 
[Pet62] den Grundstein für die Verallgemeinerung des klassischen endlichen 
Automaten gelegt. Durch diese Verallgemeinerung wurde es möglich verteil- 
te Systeme’ mit unterschiedlichen Teilzuständen zu modellieren, bei denen 
Aktionen nebenläufig? abgearbeitet werden konnten [Rei13]. 


3.2.1 Notationselemente 


Die Graphendarstellung eines klassischen Petri-Netzes umfasst zwei verschie- 
dene Elemente: Knoten und Kanten. Bei Knoten lassen sich Plätze und Tran- 
sitionen unterscheiden (vrgl. Tabelle 3.2). Dabei repräsentieren Plätze passive 
Speicherkomponenten, während Transitionen aktiv den Zustand des Systems 
verändern und damit Aktionen widerspiegeln. 


Die gerichteten Kanten eines Petri-Netzes werden als Pfeile symbolisiert. Ge- 
legentlich wird ein einziger Doppelpfeil als Kurzschreibweise für zwei Pfeile 
in entgegengesetzter Richtung verwendet. In dieser Ausarbeitung wird diese 
Kurzschreibweise aus didaktischen Gründen nicht eingesetzt. 


Formal lassen sich Knoten und Kanten über eine Netzstruktur miteinander 
verbinden [Rei13, Phil5c]: 


* Hinweis: Im Falle Carl Adam Petris standen vor allem Rechnerarchitekturen im Fokus. 
2 Hinweis: Kausal unabhängig voneinander. Die Nebenlaufigkeit ist Voraussetzung für das zeit- 
lich überlappende Ausführen von Aktionen (Parallelität). 
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Tabelle 3.2: Die Menge der Knoten eines Petri-Netzes lassen sich in zwei Teilmengen auftei- 
len. Plätze repräsentieren Speicherkomponenten während Transitionen für Aktio- 
nen stehen, die den Zustand des Systems verändern. 


Symbol Beschreibung des Knotens 


Ein Platz‘ verkörpert eine Speicherkomponente. Im Ge- 
gensatz zur Transition, die eine aktive Systemverän- 
O derung repräsentiert, wird die Speicherkomponente als 
passiv bezeichnet. Das gebräuchliche Symbol ist der 
Kreis. Selten werden Plätze auch als Ellipsen visualisiert. 


Eine Transition verkörpert eine Zustandsänderung des 

C modellierten Systems durch eine Aktion. Sowohl das 
Quadrat als auch das Rechteck sind übliche Symbole für 
Transitionen. 


* Hinweis: Je nach Kontext werden Plätze auch als Stellen bezeichnet. 


Die Netzstruktur eines Petri-Netzes ist dabei gegeben durch 


NST = (P,Q, F), (3.1) 


mit P der Menge der Platze und Q der Menge der Transitionen: 
P={p; :i=0,..,|P|-1}, (3.2) 
9={g :i=0,...,|Q|—1}, (3.3) 
so dass gilt: 


PNQ=2. (3.4) 


Die Menge der Kanten zwischen Plätzen und Transitionen (sowie umgekehrt) 
wird über die Flussrelation F der Netzstruktur festgelegt: 


FC(PXNU(OXP). (3.5) 
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Aus den Gleichungen (3.1) bis (3.5) lässt sich leicht ablesen, dass es sich bei der 
Netzstruktur NSTsowohl um einen gerichteteten als auch um einen bipartiten 
Graphen handelt [Phil5c]. 


Zur Modellierung von Zuständen und mithin eines dynamischen Verhaltens 
des Systems werden in Petri-Netzen sogenannte Marken (engl. Tokens) einge- 
setzt. Bei elementaren Systemnetzen wird nur eine Sorte von Marken genutzt 
— diese Marken werden üblicherweise durch schwarze Punkte symbolisiert 
[Rei13]. Die Verteilung der Marken auf den Plätzen wird als Markierung be- 
zeichnet und spiegelt den Zustand des Petri-Netzes wider. 


Eine sogenannte Anfangsmarkierung Mọ mitsamt der zugehörigen Netz- 
struktur NST wird in diesem Zusammenhang als elementares Systemnetz 
bezeichnet [Rei13]. Formal: 


ESN = (NST, My) (3.6) 


mit Anfangsmarkierung 
My: PON. (3.7) 


Die Anfangsmarkierung reprasentiert den Anfangszustandes des Netzes und 
gibt an, wie viele Marken Mo(p) € N jeder Platz p initial trägt. Neue Markie- 
rungen M’ entstehen durch schaltende Transitionen. Dabei werden Marken 
verbraucht bzw. erzeugt, d.h. den Plätzen hinzugefügt oder entnommen. 


Grundvoraussetzung für schaltende Transitionen ist es allerdings, dass diese 
aktiviert sind. Eine Aktivierung für eine Transition q liegt vor wenn: M(p) > 
1 für alle Plätze p im Vorbereich *q von q mit 


ga=ipePl(pgd)eF}. (3.8) 


Weiterhin ist der Nachbereich von q gegeben durch: 


q =tpePl|(ap)eF}. (3.9) 
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In einem Schaltschritt M + M’ einer Transition q entsteht für jeden Platz p 
eine neue Markierung M’ derart dass [Phil5c]: 


M(p)-1 falls p € 'q und p ¢ q' 
M'(p)=4M(p)+1 falls p E€q' undpé'’q. (3.10) 
M(p) sonst 


Aus Gleichung (3.10) folgt, dass die Markierung eines Platzes beibehalten 
wird, wenn sich dieser sowohl im Vorbereich als auch gleichzeitig im Nach- 
bereich einer Transition befindet. In der Graphendarstellung existiert also 
eine Kante von der Transition zum Platz und umgekehrt. 


Zur Verdeutlichung der Zusammenhänge sind in Tabelle 3.3 vier elementare 
Systemnetze abgebildet. 


Zeile 1 zeigt die Transition qg mit Platz pọ als einziges Element des Vorbe- 
reichs "go und Platz p; als einziges Element des Nachbereichs qg*. Die Tran- 
sition qo ist aktiviert, da für alle Elemente des Vorbereiches, und damit für po, 
gilt: M(po) > 1. Sobald qo schaltet, wird ein Marke von all jenen Plätzen ent- 
nommen, die sich ausschließlich im Vorbereich von go befinden. Das bedeutet 
für den vorliegenden Fall: M'(pọ) = M(pp) — 1 = 0. 


Darüber hinaus wird den Plätzen, die sich nur im Nachbereich befinden 
(sprich: pı) eine Marke hinzugefügt: M’(p,) = M(p,)+1 = 1. Die Transition 
Qo ist nach dem Schalten nicht mehr aktiviert, da Platz pọ im Vorbereich der 
Transition gg nun keine Marke trägt. 


Die Transition qo des elementaren Systemnetzes in Zeile 2 der Tabelle 3.3 ist 
aktiviert: alle Plätze des Vorbereichs tragen eine Marke. Beim Schalten bleibt 
allerdings die Marke in Platz pp erhalten, da sich pọ gleichzeitig im Vor- als 
auch im Nachbereich der Transition qo befindet. Für Platz p,, der sich aus- 
schließlich im Nachbereich befindet, ergibt sich die Markierung M’(p}) = 1 
analog zu Zeile 1. Nach dem Schalten bleibt die Transition allerdings aktiviert, 
da sich im Vorbereich der Transition nach wie vor eine Marke befindet. 
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Tabelle 3.3: Jede der vier Zeilen der Tabelle zeigt zwei Markierungen eines anderen elementaren 
Systemnetzes ESN - einmal bevor Transition Qo geschaltet hat und einmal nachdem 
Transition Qo geschaltet hat. Beim Schaltvorgang können Marken verbraucht und 
auch erzeugt werden. 


Netz Vor dem Schalten Nach dem Schalten 


j O-O On „Oo 


rt CTE- O Os mO 


Po Po 
go P2 qo P2 


d) EO ERC) 
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Analog zu Zeile 1 ist die Transition qg das elementaren Systemnetzes in Zeile 
3 zunächst aktiviert. Beim Schalten werden in allen Plätzen des Nachbereichs 
der Transition qọ Marken erzeugt. Dadurch entstehen neue Markierungen 
M’(pı) = 1 und M’(p) = 1. Da M’'(po) £ 1 ist die Transition nach dem 
Schaltschritt nicht mehr aktiviert. 


Zeile 4 der Tabelle 3.3 zeigt ein weiteres elementares Systemnetz. Auch hier ist 
die Transition qo aktiviert, denn für die Plätze im Vorbereich der Transition 
gilt: M(po) = 2 und M(pı) = 1 und damit sind die Markierungen aller Plätze 
im Vorbereich > 1. Im Schaltschritt der Transition werden Marken im Vorbe- 
reich entfernt, also M’(po) = M(po) — 1 = 0 und M'(p,) = M(pı)-1=1. 
Weiterhin werden Marken im Nachbereich erzeugt: M’(p,) = M(p2) +1 = 
1. Eine Aktivierung der Transition qọ liegt nun nicht mehr vor. Denn, da 
M'(po) = 0, ist M'(p) £ 1 für alle Plätze p im Vorbereich. 


Analog zu den Definition von Vor- und Nachbereichen von Transitionen (vgl. 
Gleichungen (3.8) und (3.9)), sei nun der Vorbereich eines Platzes p gegeben 
durch: 


‘p={qe2|(Qp)eEF}. (3.11) 


Weiterhin sei der Nachbereich von p gegeben durch: 


p’ ={q€Q| (p,q) € F}. (3.12) 


In Zeile 4 der Tabelle 3.3 gilt für den Platz p, beispielsweise: * p) = {go} und 
P2° = Ø. Für den Platz pọ gilt andererseits: * pọ = Ø und po’ = {qo}. 


3.2.2 Verschaltungen 


Bei einem Arbeitsablauf lassen sich typische Verschaltungen unterscheiden: 
sequentiell, selektiv, nebenläufig und iterativ [Van04]. Tabelle 3.4 zeigt Reprä- 
sentanten solcher Verschaltungen als Petri-Netz. 
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Tabelle 3.4: Typische Verschaltungen im Kontext von Arbeitsabläufen - dargestellt als Petri- 
Netze. Die Plätze tragen aus Gründen der Übersichtlichkeit keine Namen. 


Verschaltung Beispielhafter Graph 


a b 
Sequentiell COP CORO 


Selektiv X qı b q3 C) 


Nebenlaufig CEL 


a b qo 
Iterativ P L 
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Die sequentielle Verschaltung von Transitionen (vrgl. Tabelle 3.4) stellt si- 
cher, dass Aktionen eines Arbeitsablaufs (repräsentiert durch Transitionen) 
nacheinander ausgeführt werden. Im Beispiel kann Transition b erst schal- 
ten, wenn zuvor Transition a geschaltet hat. 


Für das explizite Modellieren einer selektiven Verschaltung werden Hilfstran- 
sitionen benötigt, die in Zeile 2 der Tabelle 3.4 mit qọ und qı angegeben sind. 
Eine Marke wird dadurch entweder im Vorbereich der Transition a oder aber 
im Vorbereich der Transition b erzeugt. Dieses Teilkonstrukt wird auch als 
OR-Split bezeichnet. Der OR-Split bewirkt also, dass entweder die eine oder 
aber die andere Aktion des Arbeitsablaufs zur Ausführung kommen kann. Das 
Gegenstück zum OR-Split ist der sogenannte OR-Join, der durch die Transi- 
tionen g, und q3 repräsentiert wird. Die Transitionen sorgen durch ihren ge- 
meinsamen Nachbereich dafür, dass die einzelnen Stränge wieder gebündelt 
werden. 


Um Nebenläufigkeiten zu modellieren, sind Transitionen notwendig, deren 
Nach- bzw. Vorbereich mehrere Plätze aufweist. In Zeile 3 der Tabelle 3.4 sorgt 
etwa die Transition qo dafür, dass jeweils eine Marke im Vorbereich der Tran- 
sition a und auch der Transition b erzeugt wird. Dieses Konstrukt, auch AND- 
Split genannt, bewirkt also, dass sowohl a als auch b zur Ausführung gebracht 
werden können - und zwar in beliebiger Reihenfolge. Um beide Stränge wie- 
der zu vereinen wird ein AND-Join verwendet, welche das Schalten weiterer 
Transitionen erlaubt, sobald die Transitionen beider Stränge geschaltet haben. 


Für eine Iteration werden zwei Hilfstransitionen benötigt, die selektiv die Ite- 
ration fortführen oder aber beenden können. Zeile 4 der Tabelle 3.4 zeigt ein 
anschauliches Beispiel. Hierbei wird Transition a genau einmal ausgeführt, 
wohingegen Transition b beliebig oft zur Ausführung gebracht werden kann. 
Dabei dient selektiv Hilfstransition qı zum Fortführen der Iteration oder aber 
qo zum Beenden der Iteration. 
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3.2.3 Workflow-Netze 


Sogenannte Workflow-Netze (engl. Workflow Nets) sind eine Unterklasse der 
Petri-Netze, welche von van der Aalst und Kollegen speziell für die Modellie- 
rung von Geschäftsprozessen definiert wurden [Aal97, Aal98]. 


Eine Netzstruktur NST = (P, Q, F) mit Pouetle # Psenke € P ist genau dann 
ein Workflow-Netz, wenn folgende drei Bedingungen gelten [Aal05, Zel20]: 


" Pouelle =ø, Áp € P \ {Pouetie} :'p=®, (3.13) 
Psenke“ =ø, Áp € P \ {Dsenke} : Pp = Ø, (3.14) 
Vx € (P U Q) : x liegt auf einem Pfad von Poyetie nach Psenke- (3.15) 


Dabei spezifizieren die ersten beiden Bedingungen (3.13) und (3.14), dass das 
Workflow-Netz genau einen ausgezeichneten Platz Pouere hat, der als alleini- 
ge Quelle des Netzes fungiert - weiterhin existiert genau ein ausgezeichneter 
Platz Psenke, der als alleinige Senke des Netzes dient. Hierfür muss zunächst 
gelten, dass der Vorbereich des Platzes Pouene leer ist. Genauso muss der Nach- 
bereich des Platzes Psenke leer sein. Weiterhin dürfen keine alternativen Plätze 
innerhalb des Netzes existieren, für welche Vor- bzw. Nachbereich ebenso leer 
sind. 


Motivation für die spezielle Struktur der Workflow-Netze mit ausgezeichne- 
ter Quelle und Senke ist, dass jeder Workflow als Automatisierung eines Ge- 
schäftsprozesses letztlich der Wertschöpfung dient und demnach einen wohl- 
definierten Start und ein wohldefiniertes Ende hat, zwischen denen alle Ak- 
tionen liegen [Lau20]. 


Weiterhin wird durch die dritte Bedingung (3.15) sichergestellt, dass das Petri- 
Netz stark zusammenhängend (engl. strongly connected) ist. Dies bedeutet für 
das Workflow-Netz, dass ein beliebiges Element aus der Menge seiner Plätze 
oder aber der Menge seiner Transitionen auf einem gerichteten Pfad von des- 
sen Quelle zu dessen Senke liegen muss. Durch diese Bedingung werden soge- 
nannte dangling tasks and/or conditions [Aal97] verhindert. Sprich: es wird 
sichergestellt, dass es keine Aufgaben oder Bedingungen im luftleeren Raum 


60 


3.2 Petri-Netze 


gibt, die nicht zur Abarbeitung des Workflows dienen. Weiterhin wird sicher- 
gestellt, dass es sich bei dem durch das Netz repräsentierten Prozess nicht 
um einen Prozess handelt, der eigentlich in mehrere, vollständig voneinander 
unabhängige Teilprozesse unterteilt werden könnte. 


Man kann zeigen, dass es sich bei den aus den drei obigen Bedingungen 
resultierenden Workflow-Netzen um spezielle Petri-Netze handelt, die die 
Eigenschaft der sogenannten Soundness [Aal96] mit sich bringen. Dabei be- 
zeichnet man ein Petri-Netz genau dann als sound, wenn es folgende für die 
(Geschäfts-)Prozessmodellierung wünschenswerte Eigenschaften aufweist 
[Aal16, Lau20]: 


« Das Netz kann terminieren: Ausgehend von jeder Markierung, die aus 
einer möglichen Anfangsmarkierung heraus erreichbar ist, kann eine 
Markierung mit nur einer Marke auf dem Endplatz erreicht werden. 
Sprich: ein modellierter Prozess kann also immer abgeschlossen wer- 
den. 


« Das Netz terminiert richtig: Für jede Markierung, die aus einer mög- 
lichen Anfangsmarkierung heraus erreichbar ist, muss gelten: Besitzt 
diese Markierung eine Marke auf dem Endplatz, so müssen alle ande- 
ren Plätze leer sein. Somit dürfen also nach Abschluss des modellierten 
Prozesses keine Marken mehr im Netz verbleiben. 


« Das Netz besitzt keine überflüssigen Transitionen: Für jede Transition 
muss eine aus der Anfangsmarkierung heraus erreichbare Markierung 
existieren, die diese Transition aktiviert. Jede Transition ist damit Teil 
eines Prozessschrittes, der tatsächlich im modellierten Prozesses exis- 
tiert. 


« Plätze können nur eine und nicht mehrere Marken tragen. 


Spezielle Workflow-Netze, für die bestimmte syntaktische Anforderun- 
gen gelten und die daher konstruktionsbedingt immer die Eigenschaft der 
Soundness (vgl. Kapitel 3.2.3) in sich tragen, sind die sogenannten blockstruk- 
turierten Workflow-Netze (engl. block-structured workflow-nets) [Aal16]. 
Zwar existieren in der Literatur unterschiedliche Definitionen [Aal16], aber 


61 


3 Prozessmodelle 
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Abbildung 3.1: Die Abbildung aus [Lee14] zeigt ein Beispiel für ein blockstrukturier- 
tes Workflow-Netz. Dieses lässt sich rekursiv in kleinere blockstruktu- 
rierte Workflow-Netze unterteilen. Letztlich besteht ein blockstrukturiertes 
Workflow-Netz aus mehreren aneinander gehängten und verschachtelten Blö- 
cken. Auf der oberen Ebene sind zwei Blöcke sequentiell verschaltet. Der erste 
dieser beiden Blöcke lässt sich weiter aufteilen in eine selektive Verschaltung, die 
im oberen Ast weiter in eine nebenläufige Verschaltung aufgeteilt wird. Auch der 
zweite Block besteht aus einer selektiven Verschaltung. Die oberen beiden Äste 
werden weiter unterteilt in eine Iteration, sowie eine sequentielle Verschaltung. 


üblicherweise spricht man dann von einem block-strukturierten Workflow- 
Netz, wenn sich dieses rekursiv anhand von Basisstrukturen erzeugen lässt 
[Löp20], bzw. wenn sich ein gegebenes Workflow-Netz rekursiv in kleinere 
blockstrukturierte Workflow-Netze unterteilen lässt [Zel20, Lee14]. 


Als Resultat sind in einem blockstrukturierten Workflow-Netz alle sequen- 
tiellen, selektiven und nebenläufigen Verschaltungen sowie Iterationen als 
Blöcke modelliert, die einen eindeutigen Anfang und ein eindeutiges Ende 
besitzen [Lau20]. Das bedeutet, dass es zu jeder Verzweigung eine korrespon- 
dierende Vereinigung geben muss, beispielsweise also für jeden AND-Split ein 
zugehöriger AND-Join existieren muss [Aal16]. Die einzelnen Blöcke dürfen 
in einem blockstrukturierten Workflow-Netz verschachtelt werden, sich aber 
nicht überlappen [Lau20]. 


Abbildung 3.1 zeigt ein Beispiel eines blockstrukturierten Workflow-Netzes: 
Letzlich besteht das blockstrukturierte Workflow-Netz aus mehreren anein- 
andergehängten und/oder verschachtelten Blöcken. Auf der obersten Ebene 
gibt es zwei sequentiell verschaltete Blöcke, die ihrerseits wieder in Substruk- 
turen aus selektiven, nebenläufigen und sequentiellen Verschaltungen, sowie 
einer Iteration zerlegt werden können. 
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3.3 UML Aktivitätsdiagramme 


Im Jahr 1996 entstand durch die Verbindung der Arbeiten von Jim Rumbaugh, 
Ivar Jacobson und Grady Booch die sogenannte Unified Modeling Language 
(UML) in Version 0.9*. Da in den 1990er Jahre eine Vielzahl an widersprüchli- 
chen Modellierungsmöglichkeiten existierte, begrüßten führende Unterneh- 
men wie Oracle, Microsoft und IBM die Bestrebungen nach einer gemeinsa- 
men, intuitiv verständlichen Modellierungssprache [Kec21]. 


Diese Zeit wird teils mit dem Begriff der Notationskrise umschrieben. Neue 
Konzepte, wie die der Objektorientierung, konnten zu dieser Zeit noch nicht 
einheitlich dargestellt und ausgetauscht werden. Dies hat sich mit Einführung 
der UML 1.3, die letztlich als Gewinnerin aus der Notationskrise hervorging, 
grundlegend geändert. 


Sechs Jahre nach der Zertifizierung und Freigabe der UML 1.3 durch das Stan- 
dardisierungsgremium der Object Management Group (OMG) in 1999, wur- 
den mit Version 2 grundlegende Modifikationen seitens der OMG durchge- 
führt. Im Zuge dieser Änderungen wurden Aktivitätsdiagramme der Seman- 
tik der Petri-Netze (siehe Kapitel 3.2, Seite 52) angepasst und orientieren sich 
damit am Konzept der sogenannten Marken? [OMG17]. In dieser Arbeit wer- 
den Diagramme der UML in Version 2 genutzt. 


3.3.1 Notationselemente 


In der aktuellen UML 2 Spezifikation [OMG17] werden 14 Diagrammtypen 
definiert. Jede dieser Diagrammtypen lässt sich entweder den sogenannten 
Struktur- oder aber den Verhaltensdiagrammen zuordnen [OMG17]. Mit ers- 
teren lassen sich die statischen Aspekte eines Systems modellieren - z.B. die 
feste Aufteilung eines Systems in Klassen (Klassendiagramm). Mit Verhaltens- 
diagrammen kann hingegen das dynamische Verhalten eines Systems und sei- 
ner Komponenten formalisiert werden [Phi15b, Phi16b]. 


* Anmerkung: Der Kreis der Autoren wird auch als „Die drei Amigos“ bezeichnet 
? Hinweis: Die Marken werden im Gegensatz zu Petri-Netzen nicht explizit dargestellt. 
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Aktivitätsdiagramm 


Aktivität 


EI I ED 


Abbildung 3.2: Zusammenhang zwischen Aktivitätsdiagramm, Aktivität, Aktion. Ein Aktivi- 
tätsdiagramm beinhaltet die Aktivität - diese legt durch die Verknüpfung von 
Aktionen mögliche Abläufe fest. 


Aktivitätsdiagramme zählen zu den Verhaltensdiagrammen, geben also eine 
Antwort darauf, wie bestimmte Abläufe abgearbeitet werden [Rup12, Phi17d]. 
Dazu lassen sich in einer Aktivitäten verschiedene Notationselemente, wie 
z.B. Aktionen nutzen. 


Abbildung 3.2 zeigt die Zusammenhänge zwischen Aktivitätsdiagramm, Ak- 
tivität und Aktionen. Das Aktivitätsdiagramm beinhaltet die Aktivität. Inner- 
halb einer Aktivität können Knoten, wie z.B. Aktionen, mittels gerichteter 
Kanten verknüpft werden, um die Menge möglicher Abläufe festzulegen. 


Bei der Menge der (Aktivitäts-)knoten lassen sich drei Teilmengen unterschei- 
den [Kec21]: 


1. Menge der ausführbaren Knoten 
2. Menge der Objektknoten 


3. Menge der Kontrollknoten 
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Tabelle 3.5: Wichtige Repräsentanten der Aktivitätsknoten der Teilmengen 1 und 2. 


Notationselement Beschreibung 
Eine Aktion repräsentiert einen Schritt innerhalb 
einer Aktivität. Dieser wird in der Aktivität nicht 
Aktion weiter zerlegt. Eine Aktion kann mit anderen Ak- 
tionen, Objektknoten oder Kontrollknoten ver- 
knüpft sein. 


Ein Objektknoten dient als Stellvertreter für In- 


Typ des stanzen eines festgelegten Typs (z.B. bestimmte 

Objektes Variablen oder aber Konstanten). Er kann ebenso 
wie eine Aktion mit anderen Knoten verknüpft 
sein. 


Zur Menge der ausführbaren Knoten zählen die (atomaren) Aktionen (vgl. 
Tabelle 3.5). Sie werden durch abgerundete Rechtecke dargestellt und verkör- 
pern die kleinste Einheit ausführbarer Funktionalität [OMG17]- sie werden 
in der betreffenden Aktivität nicht weiter zerlegt. 


Ein weitere Teilmenge der Aktivitätsknoten ist die Menge der Objektknoten 
(vgl. Tabelle 3.5). Dargestellt werden Objektknoten durch ein Rechteck. Der 
Name des Knotens repräsentiert dabei lediglich einen bestimmten (Instanz- 
)Typ, ist also ein Stellvertreter für mögliche Ausprägungen der Daten in Form 
konkreter Instanzen’. 


Durch Verknüpfung von Objektknoten und Kanten können Datenflüsse dar- 
gestellt werden und mithin können Ein- und/oder Ausgabeparameter aus- 
führbarer Knoten spezifiziert werden. 


Die letzte Teilmenge der Aktivitätsknoten ist die Menge der Kontrollknoten 
(vgl. Tabelle 3.6 auf Seite 66). Dabei können für für die Modellierung alterna- 
tiver Entscheidungs- und Verbindungsknoten eingesetzt werden. 


* Hinweis: In Zusammenhang mit Entity-Relationship Modellen kann hier auch gleichbedeutend 
von Entiätstypen bzw. Entitäten gesprochen werden. 
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Tabelle 3.6: Aktivitätsknoten Teilmenge 3: Übersicht der Kontrollknoten. 


Notationselement 


[Bed. 1] 


[Bed. 2] 


Beschreibung 


Die Entscheidung teilt Abläufe mittels Bedingun- 
gen in Alternativen auf. Symbolisiert wird dies 
durch eine Raute. Die Bedingungen an den ab- 
gehenden Kanten müssen vollständig und wider- 
spruchsfrei sein. Hinweis: Teils wird statt des Be- 
griffs der Raute die wortwörtliche Übersetzung 
aus dem Englischen genutzt: Diamant. 


Die Verbindung bündelt mittels einer Raute alter- 
native Abläufe. Dabei genügt das Eintreffen eines 
Ablaufs, um über die ausgehende Kante weitere 
Knoten anzusteuern. 


Die Gabelung nutzt Synchronisationsbalken um 
Abläufe in mehrere Teilabläufe aufzuspalten. Da- 
durch können Aktionen am Ausgang der Gabe- 
lung nebenläufig abgearbeitet werden. 


9 
+E 
+ 


Die Synchronisation nutzt Synchronisationsbal- 
ken um mehrere Teilabläufe zusammenzuführen. 
Es wird dabei auf das Eintreffen aller verbunde- 
nen Teilabläufe gewartet. 


Der Start (-knoten) symbolisiert den Beginn ei- 
ner Aktivität. Dieser Knoten besitzt nie eine ein- 
gehende Kante. 


Q 
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Der Ende (-knoten) markiert den Endpunkt ei- 
ner Aktivität. Alle Abläufe einer Aktivität werden 
durch ihn beendet. 


3.3 UML Aktivitätsdiagramme 


Nebenläufigkeiten können hingegen mit Gabelungs- und Synchronisations- 
knoten umgesetzt werden. In jedem Falle muss die Aktivität einen Start- sowie 
Endknoten enthalten. 


Die Kanten einer Aktivität sind weitere Notationselemente. Mit ihnen lassen 
sich einzelne Aktivitätsknoten verbinden - die gerichteten Kanten können 
dabei mit Bedingungen versehen werden. Es können zwei Mengen an Kanten 
unterschieden werden [OMG17]: 


1. Menge der Kanten des Kontrollflusses 


2. Menge der Kanten des Datenflusses 


Gerichtete Kanten zwischen ausführbaren Knoten untereinander sowie von 
oder zu Kontrollknoten repräsentieren den Kontrollfluss. Ist allerdings ein Ob- 
jektknoten eine Quelle oder Senke einer gerichteten Kante, so handelt es sich 
um einen Datenfluss [Rup12]. 


Der Fluss an Daten als Eingabe- bzw. Ausgabeparameter von Aktionen kann 
alternativ über eine Pin-Notation verdeutlicht werden [Rup12, St605, Phil8e]. 
Tabelle 3.7 stellt beide Darstellungen gegenüber. In dieser Ausarbeitung findet 
die Pin-Notation Anwendung. 


Tabelle 3.7: Für eine kompakte Darstellung von Datenflüssen, im Besonderen zur Hervorhebung 
von Eingabe- und Ausgabeparametern, kann die Pin-Notation verwendet werden. 
In Anlehnung an [Phil8e, Phi19a]. 


Pin Notation Alternative Schreibweise 


Name der E Typ des Name der Typ des 
Aktion Objektes Aktion Objektes 
Name der E Typ des Name der Typ des 
Aktion Objektes Aktion Objektes 
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Tabelle 3.8: Typische Verschaltungen von Aktivitätsknoten in Anlehnung an [Phi15b, Phil6a, 
Phil6b, Phi17c, Phi17d]. Bei einer sequentiellen Verschaltungen werden die Aktio- 
nen a und b nacheinander ausgeführt. Im selektiven Fall wird entweder Aktion a 
oder aber Aktion b ausgeführt, während im nebenläufigen Falle die Aktionen a und 
b in beliebiger Reihenfolge ausgeführt werden können “. 


Verschaltung Beispielhafter Graph 


Sequentiell (a ) Ge? Q 


Selektiv 

a 
Nebenläufig 

b 
Iterativ 


* Hinweis: Einzelne Aktivitätsknoten sind in den Tabellen 3.5 und 3.6 ab Seite 65 gelistet. 
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3.3.2 Verschaltungen 


Tabelle 3.8 zeigt in der ersten Zeile eine sequentielle Verschaltung von Aktio- 
nen, d.h. im beispielhaften Graphen wird zunächst die Aktion a und dann die 
Aktion b abgearbeitet. 


Die zweite Zeile der Tabelle 3.8 zeigt eine selektive Verschaltung. Hier wird 
also in Abhängigkeit einer Entscheidung bzw. damit verknüpften Bedingun- 
gen entweder Aktion a oder aber Aktion b abgearbeitet und schließlich die 
Kanten über eine Verbindung wieder gebündelt. 


Die dritte Zeile der Tabelle 3.8 stellt eine nebenläufige Verschaltung dar. Das 
bedeutet, dass die Aktionen a und b in beliebiger Reihenfolge ausgeführt wer- 
den können. Dazu wird eine Gabelung zur Aufspaltung der Kanten genutzt, 
die nachfolgenden Kanten werden dann durch eine Synchronisation wieder 
zusammengeführt. 


Die letzte Zeile der Tabelle 3.8 zeigt eine iterative Verschaltung. Die Aktion 
a kann dabei mehrfach ausgeführt werden. Dazu wird der Aktion a eine Ent- 
scheidung nachgelagert, mit der die Iteration fortgesetzt oder beendet werden 
kann. Die rückwärtige Kante wird über eine Verbindung mit der Kante des 
Startknotens vereint. 


3.3.3 FHIR Repräsentationen 


Die dargestellten Verschaltungen lassen sich, wie bereits in Kapitel 2.5.3 an- 
gedeutet, in FHIR repräsentieren. Für die sequentielle Verknüpfung zweier 
Aktionen a und b aus Zeile 1 der Tabelle 3.8 ergibt sich die Darstellung in Ab- 
bildung 3.3. Dabei werden die Knoten der Sequenz durch die anonyme Aktion 
:Action gruppiert (groupingBehavior=logical-group). Alle Aktionen der Grup- 
pe sollen ausgeführt werden (selectionBehavior=all). 


In Abbildung 3.3 sind das die Aktion a der Klasse Action (a:Action) und die 
Aktion b der Klasse Action (b:Action). Darüber hinaus soll die Gruppe einma- 


lig zur Ausführung kommen (cardinalityBehavior=single). Allerdings sollen 
die Aktionen nicht nebenläufig voneinander zum Zuge kommen, sondern die 
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‚Action 


groupingBehavior=logical-group 
selectionBehavior=all 
cardinalityBehavior=single 


A 


before-end 


b:Action 


before-end f after-end 
a:Action ce 


Abbildung 3.3: Die Abbildung zeigt im oberen Teil die sequentielle Verschaltung zweier Ak- 
tionen a und b als Ausschnitt aus einer UML Aktivitat. Im unteren Bereich ist 
die entsprechende FHIR-Repräsentation verdeutlicht. Hierbei werden a und b 
ebenso sequentiell ausgeführt - d.h. zunächst wird Aktion a und dann Akti- 
on b ausgeführt. Ein Knoten des Typs Action bündelt die Sequenz (groupingBe- 
havior=logical-group) über das Attribut selectionBehavior=all. Die verbundenen 
Kindknoten a und b, von denen alle ausgeführt werden können, müssen been- 
det sein (groupingBehavior=before-end) bevor die Elternaktion endet und mit- 
hin die Ausführung andere Aktion außerhalb der Gruppe beginnen kann. Eine 
mehrfache Ausführung des Elternknotens ist ausgeschlossen (cardinalityBeha- 
vior=single) 


Aktion b soll erst nach Beendigung der Aktion a ausgeführt werden können. 
Dazu wird der Aktion b die relatedAction a mit relationship=after-end zuge- 
wiesen. Weiterhin sollen alle Aktionen beendet sein, ehe weitere Aktionen 
außerhalb der Gruppe angestoßen werden. Dazu werden sowohl der Akti- 
on a also auch der Aktion b die anonyme Aktion als relatedAction mit relati- 
onship=before-end zugewiesen. 
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‚Action 


groupingBehavior=logical-group 
selectionBehavior=exactly-one 
cardinalityBehavior=single 


before-end 


b:Action 


before-end 


a:Action 


Abbildung 3.4: Die Abbildung zeigt im oberen Teil einen Ausschnitt aus einer UML Aktivitat 
bei dem zwei Aktionen a und b selektiv verschaltet sind. Im unteren Teil ist 
die entsprechende FHIR-Repräsentation dargestellt. Im Unterschied zu Abbil- 
dung 3.3 weißt die gruppierende, anonyme Aktion das Attribut selectionBeha- 
vior=exactly-one auf. Weiterhin entfällt bei der selektiven Verschaltung die se- 
quentielle Abhängigkeit zwischen Aktion a und b (after-end). 


In Abbildung 3.4 ist die selektive Verschaltung zweier Aktionen a und b darge- 
stellt. Einmal als Ausschnitt einer UML Aktivität (oben) und einmal als FHIR- 
Repräsentation (unten). Ebenso wie im selektiven Falle kommt eine anonyme, 
gruppierende Aktion zum Einsatz. Im Unterschied zu Abbildung 3.3 weißt 
die Gruppe allerdings ein selectionBehavior=exactly-one auf. Sprich: Entwe- 
der Aktion a oder aber Aktion b kann ausgeführt werden. Weiterhin bestehen 
zwischen den beiden Aktionen keine Abhängigkeiten, sodass solcherlei Bezie- 
hungen in der Abbildung nicht zu sehen sind. 
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a — 
b c 
‚Action 


groupingBehavior=logical-group 
selectionBehavior=all 
cardinalityBehavior=single 


before-end 


b:Action 


before-end 


a:Action 


> 


Abbildung 3.5: Die Abbildung zeigt im oberen Teil einen Ausschnitt aus einer UML Aktivität bei 
dem zwei Aktionen a und b nebenläufig verschaltet wurden. Im unteren Teil ist 
die FHIR-Repräsentation zu sehen. Im Unterschied zu Abbildung 3.4 weißt die 
anonyme Aktion das Attribut selectionBehavior=all auf. Dadurch können beide 
Aktionen unabhängig voneinander ausgeführt werden. Allerdings: Beide Aktio- 
nen müssen beendet sein, damit die Elternaktion enden kann. 


In Abbildung 3.5 findet sich die nebenläufige Verschaltung von Aktionen. Da- 
bei wird für die gruppierende, anonyme Aktion :Action das Attribut selec- 
tionBehavior=all gesetzt. Sprich: Beide Aktionen a und b sollen ausgeführt 
werden. Zusätzlich können beide Aktionen nebenläufig zum Zuge kommen, 
da keine Abhängigkeiten zwischen beiden Aktionen gesetzt sind. Allerdings 
müssen beide Aktionen beendet worden sein, bevor die Elternaktion enden 
kann (before-end). 
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‚Action 


groupingBehavior=logical-group 
selectionBehavior=exactly-one 
cardinalityBehavior=multiple 


before-end 


a:Action 


Abbildung 3.6: Die Abbildung zeigt die zeitliche Abhängigkeit zweier Aktionen a und b. Oben 
dargestellt als Ausschnitt eines UML Aktivitätsdiagramms und unten als Aus- 
schnitt eines FHIR Plans. Unten zeigt die gerichtete Kante dem eigentlichen Kon- 
trollfluss eines UML Aktivitätsdiagramms entgegen: Sobald Aktion a geendet 
hat, kann Aktion b ausgeführt werden (after-end). 


In Abbildung 3.6 ist schließlich die iterative Verschaltung von Aktionen ab- 
gebildet (vgl. Tabelle 3.8 auf Seite 68). Die Aktion a wird dabei einer grup- 
pierenden, anonymen Aktion zugeordnet (groupingBehavior=logical-group). 
Zusätzlich wird cardinalityBehavior=multiple gesetzt. Dadurch können Kind- 
aktionen (in diesem Falle a) mehrfach ausgeführt werden. 
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3.4 Prozessbäume 


Prozessbäume (engl. Process Trees) sind baumförmige Prozessmodelle, die als 
weitere Repräsentation für die in Kapitel 3.2.3 beschriebenen Workflow-Netze 
in [Aal11] eingeführt wurden. Da sie neben der graphischen Darstellung als 
Baum auch über eine textuelle Schreibweise verfügen, werden sie oft alterna- 
tiv als kompakte Darstellung von Workflow-Netzen verwendet [Lee13]. 


3.4.1 Aufbau und Notationselemente 


Ein Prozessbaum T = (X, Y) ist zunächst einmal ein gerichteter, azyklischer 
Graph (DAG) mit Knotenmenge X und Kantenmenge Y. Seine Knoten lassen 
sich unterteilen in: 


e innere Knoten (Verzweigungsknoten mit Ausgangsgrad > 1), 


« Blattknoten (Endknoten mit Ausgangsgrad 0). 


Der Prozessbaum ist ein Wurzelbaum und besitzt einen speziellen inneren 
Knoten r € X, den sogenannten Wurzelknoten (vgl. Abbildung 3.7). Dieser 
besitzt als einziger Knoten des Baumes den Eingangsgrad 0. In einem Wur- 
zelbaum gilt, dass gerichtete Wege! vom Wurzelknoten r zu jedem anderen 
Knoten des Baumes existieren [Hoc10]. D.h.: 


Yo € X Iwy” &T ist ein Wurzelbaum mit Wurzel r. 


* Hinweis: Der Begriff eines gerichteten Weges innerhalb eines Graphens wird in der Literatur 
nicht einheitlich verwendet. Einige Autoren bezeichnen mit dem Begriff Weg eine Folge von 
Knoten, z.B. [Die10] (dabei müssen bei einem gerichteten Weg die aufeinander folgenden Kno- 
ten über gerichtete Kanten des Graphen verbunden sein). Andere Autoren bezeichnen mit dem 
Begriff Weg dagegen eine Folge, in der sich Knoten und Kanten des Graphen abwechseln, z.B. 
[Tit19] (dabei gilt für gerichtete Graphen, das kein Knoten und keine Kante mehr als einmal 
auftreten). Man spricht in diesem Zusammenhang auch von einem Kantenzug. Für die gege- 
bene Beschreibung des Prozessbaums können tatsächlich beide Deutungen alternativ verwen- 
det werden, ohne dass dies eine Auswirkung auf die Definition des Prozessbaums oder dessen 
Komponenten hat. In dieser Arbeit wird der Weg innerhalb eines gerichteten Graphen G als 
Knotenfolge definiert und der Weg vom Knoten u bis zum Knoten v durch wo symbolisiert. 
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Weiterhin lassen sich spezielle Knotenmengen definieren: 


e Pav) = {u E€ X|A(u,v) € Y}: Menge der Knoten, von denen eine 
gerichtete Kante nach v führt (d.h. der Elternknoten von v), 


e Desv) = {u € X|3w7 ""}: Menge der Knoten, die auf einem von v 
ausgehenden Weg liegen (d.h. die Nachfahren von v), 


e Chi(v) = {u € X| A(v,u) € Y}: Menge der direkten Nachfahren von v 
(d.h. die Kinder von v). 


Die Blattknoten des Prozessbaumes stellen die einzelnen Aktionen innerhalb 
des modellierten Prozesses dar. Die inneren Knoten repräsentieren soge- 
nannte Operatoren. Diese definieren, wie die Einzelaktionen und Teilbäume 
- bestehend aus mehreren Aktionen und/oder Operatoren - miteinander 
verschaltet sind. In der grafischen Darstellung werden Blattknoten bzw. 
Aktionen durch Rechtecke repräsentiert, wohingegen innere Knoten bzw. 
Operatoren durch Kreise visualisiert werden (vgl. Abbildung 3.7). Sprich: 
Operatoren können nur durch die inneren Knoten des Prozessbaums re- 
präsentiert werden (nie durch die Blattknoten) - Sie haben also immer 
mindestens zwei Kinder. Die Kindknoten eines Operators können dabei 
jedoch sowohl Blattknoten als auch innere Knoten sein. 


Grundsätzlich können verschiedenste Operatoren für Prozessbäume definiert 
werden. Gängige Basisoperatoren, die für die medizinischen Prozesse eine 
Rolle spielen, sind der Operator der sequentiellen Verschaltung (repräsentiert 
durch das Symbol —), der Operator der selektiven Verschaltung (repräsentiert 
durch das Symbol x), der Operator der nebenläufigen Verschaltung (repräsen- 
tiert durch das Symbol A) und der Schleifen-Operator (repräsentiert durch das 
Symbol ©). 


Tabelle 3.9 zeigt beispielhafte Prozessbaume, die die verschiedenen grund- 
sätzlichen Verschaltungsvarianten mithilfe der Basisoperatoren darstellen, so- 
wie jeweils die dazu korrespondierenden Workflow-Netze. In der ersten Spal- 
te wird zunächst die textuelle Beschreibung des Prozessbaums mithilfe der 
Operatoren angegeben. Die Spalten zwei und drei zeigen die graphischen Re- 
präsentationen als Prozessbaum und Workflow-Netz. Die Aktion t beschreibt 
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Abbildung 3.7: Beispielhafter Prozessbaum. Seine Blätter a bis g, rechteckig dargestellt, reprä- 
sentieren die Aktionen des Prozesses. Seine inneren Knoten, kreisförmig darge- 
stellt, repräsentieren verschiedene Operatoren, die bestimmen, wie Einzelaktio- 
nen und Teilbäume miteinander verschaltet sind. Hier sind vier Basisoperatoren 
dargestellt: Die sequentielle Verschaltung (>), die selektive Verschaltung (x), 
die nebenläufige Verschaltung (A) und die Iteration (©). 


die sogenannte stille Aktion, eine Hilfsaktion, die für bestimmte Operatoren 
in Form einer Hilfstransition zum Workflow-Netz hinzugefügt werden muss. 


Weiterhin fällt in Tabelle 3.9 auf, dass für zwei der vier Basisoperatoren die 
Reihenfolge ihrer Kindknoten eine Rolle spielt [Aal11] : Für den Operator der 
sequentiellen Verschaltung bestimmt die Reihenfolge seiner Kindknoten, in 
welcher Reihenfolge diese abgearbeitet werden (von links nach rechts). 


Für den Schleifen-Operator gilt folgende Konvention, auf die auch alternati- 
ve Definitionen des Schleifen-Operators in der Literatur zurückgeführt wer- 
den können [Zel20]: Der linke Kindknoten des Schleifen-Operators ist der 
Do-Teil der Schleife. Dieser Teil wird immer ausgeführt. Nach Ausführung 
des linken Kindknotens ist das Ausführen des rechten Kindknotens, des so- 
genannten ReDo-Teils der Schleife, optional. Wird der optionale rechte Kind- 
knoten ausgeführt, muss anschließend nochmals der linke Kindknoten ausge- 
führt werden. Die Abfolge aus Do- und ReDo-Teil der Schleife kann mehrfach 
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Tabelle 3.9: Prozessbäume, bestehend aus den Basisoperatoren, sowie deren korrespondieren- 
de Workflow-Netze. Die Prozessbäume können sowohl in textueller Form als auch 
in graphischer Form dargestellt werden. Bei der Überführung von (Teil-)Bäumen 
mit den Operatoren X (selektive Verschaltung), A (nebenläufige Verschaltung) und 
© (iterative Verschaltung) in ein Workflow-Netz, müssen sogenannte stille Aktio- 
nen T als Hilfstransitionen eingefügt werden. Bei den Operatoren — (sequentielle 
Verschaltung) und © (iterative Verschaltung) ist die Reihenfolge der Kindknoten 
relevant. 


Textueller Graphischer 


Workflow-Net 
Prozessbaum Prozessbaum OU OW ANE 


=" (a, by... Z) Start Ende 


x (a, b,..., Z) 


A (a, b, ..., Z) 


O (a,r) 


Start Ende 
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wiederholt werden, die Ausführung der Schleife muss jedoch immer mit dem 
Do-Teil beendet werden. Bei den in dieser Arbeit betrachteten Prozessbäumen 
zur Abbildung medizinischer Prozesse wird für den ReDo-Teil jeweils die stil- 
le Aktion T gesetzt. Durch die so definierte Verschaltung kann eine Aktion im 
Do-Teils einmal oder beliebig oft durchgeführt werden. 


3.4.2 Formale Definition 


Mithilfe der Menge der Operatoren {>,X,A, ©} und der speziellen Hilfsak- 
tion T können Prozessbäume auf rekursive Weise formal definiert werden als: 


Definition 3.4. Gegeben sei eine Menge an Operatoren {>, X, ^A, ©}, eine 
Menge an Aktionen A, sowie eine stille Aktion r. 


e Dann ist a mit a € A U {t} ein Prozessbaum. 


e Seien To, ... , T„_ı Prozessbäume und sei ® € {>,x, A}. Dann ist auch 
&(To, ... , Tn-ı) ein Prozessbaum. 


e Seien Ty, T; Prozessbäume. Dann ist auch ©) (To, T,) ein Prozessbaum. 


Abbildung 3.8 auf Seite 79 zeigt einen beispielhaften Prozessbaum, sowie des- 
sen korrespondierendes Workflow-Netz. Der abgebildete Prozessbaum lässt 
sich mithilfe der Operatoren auch in folgender kompakter Schreibweise dar- 


stellen: > (a, © (x(ACb,c,d),e, f), T), A(h,k)). 


Prozessbäume sind als alternative Repräsentation von Workflow-Netzen zu 
sehen und lassen sich daher eins zu eins in diese überführen [Zel20]. 


Die umgekehrte Transformation von einem Workflow-Netz in einen Pro- 
zessbaum ist komplexer und wurde in [Zel20] betrachtet. Dabei konnte 
ein Algorithmus entwickelt werden, welcher für die Unterklasse der block- 
strukturierten Workflow-Netze die korrekte Übersetzung in einen Prozess- 
baum garantiert. 
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USJ0OUNPUTY 27291 Jop UOTJUAAUOY Yoeu JysLıdsju> Taqe ‘PUTS Ja]VYosIaa SuNyeyosia, asyNeE[Usqeu outs pun Sunqeyos 
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4 Transformationen zwischen 
Prozessbäumen und FHIR Plänen 


Im folgenden Kapitel 4.1 wird das Gesamtkonzept vorgestellt, welches zur Ein- 
ordnung der Transformation zwischen Prozessbäumen (vgl. Kapitel 3.4) und 
FHIR-Plänen (vgl. Kapitel 2.5.3) dient. Danach werden zunächst Prozessbäu- 
me in Kapitel 4.2 und nachfolgend FHIR-Pläne in Kapitel 4.3 als Ausgangsmo- 
delle beleuchtet. Anschließend folgt in Kapitel 4.4 die Transformation eines 
Prozessbaumes in einen FHIR-Plan, sowie die Rücktransformation in Kapitel 
4.5. Schließlich wird in Kapitel 4.6 gezeigt, inwieweit die vorgestellten Trans- 
formationen die Struktur der Originalmodelle erhalten. 


4.1 Gesamtkonzept 


Abbildung 4.1 zeigt das Gesamtkonzept, in das sich die Beiträge dieser Arbeit 
einordnen lassen. Das Konzept beschreibt ein WBS, genauer gesagt ein Ex- 
pertensystem. Wie in Kapitel 2 erläutert haben solcherlei Systeme eine Wis- 
sensbasis, die von der Wissensverarbeitung getrennt ist. Im vorliegenden Fall 
wurde, aus den in Kapitel 2.5 ausführlich dargelegten Gründen, FHIR als Wis- 
sensbasis gewählt. Die eigentliche Wissensverarbeitung erfolgt in der Pro- 
blemlösungskomponente. 


Grundvoraussetzung für ein Expertensystem ist der Wissenserwerb, vgl. Ka- 
pitel 2.2. Hierzu muss das vorhandene Expertenwissen formalisiert werden 
- im Falle des hier betrachteten Anwendungsszenarios ist dies das Wissen 
über medizinische Prozesse. Ziel der Formalisierung ist letztlich ein für alle 
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Dialog 
Forma- | 
lisierung Ablaufmodell 


Abgleich- Assistenz 
modell Analyse 


AT EB 


Wissensbasis 


Abbildung 4.1: Die Formalisierung des menschlichen Wissens kann im Dialog der medizini- 
schen und technischen Domänenexperten vollzogen werden. Ergebnis ist ein für 
alle Seiten verständliches Ablaufmodell, welches über Zwischenmodelle in die 
FHIR-basierte Wissensbasis gelangt. Weitere Details finden sich in Abbildung 
4.2. Zusätzlich können Methoden zur Entdeckung von Abläufen (vgl. Process 
Mining) über die Zwischenmodelle eingebunden werden. Aus der Wissensbasis 
können wiederum Abgleichmodelle für die Bereitstellung von Assistenzfunktio- 
nen erzeugt werden (Problemlösungskomponente). Dieser Teil des Konzeptes 
wird in Kapitel 5.4 für eine Phasendetektion bei chirurgischen Interventionen 
exemplarisch dargestellt und in nachfolgenden Kapiteln bewertet. 


Seiten verständliches Ablaufmodell, welches die Abfolge der einzelnen Pro- 
zessschritte des medizinischen Prozesses beschreibt und in einem Dialog zur 
Diskussion gestellt werden kann. 


Grundsätzlich können für ein solches Ablaufmodell unterschiedliche Pro- 
zessmodelle herangezogen werden, vgl. Kapitel 3. Aufgrund ihrer Verständ- 
lichkeit auch für nicht-technische Nutzer eignen sich insbesondere grafische 
Prozessmodelle, wie beispielsweise Geschäftsprozessmodell und -notation 
(BPMN), Ereignisgesteuerte Prozessketten (EPK) oder UML Aktivitätsdia- 
gramme [K009]. In dieser Arbeit werden UML Aktivitätsdiagramme, aus den 
in Kapitel 3.3 dargestellten positiven Eigenschaften heraus, zur Modellierung 
genutzt. 
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4.1 Gesamtkonzept 


Die darin enthaltenen Informationen über einen medizinischen Prozess müs- 
sen letztlich für die Wissensbasis des Expertensystems verfügbar gemacht 
werden. Dafür müssen die UML Aktivitätsdiagramme in FHIR überführt wer- 
den, sodass die Abläufe schließlich als FHIR-Pläne hinterlegt werden können. 
Dies erfolgt durch drei Transformationen, siehe Abbildung 4.2. 


Zunächst wird das im Expertendialog erstellte grafische Ablaufmodell in ein 
Workflow-Netz, d.h. in ein spezielles Petri-Netz wie in Kapitel 3.2.3 beschrie- 
ben, überführt. Dies kann mittels der in [Fav15] vorgestellten Übersetzungsre- 
geln erfolgen. Hierbei ist die konkrete grafische Modell, d.h. ob das grafische 
Modell beispielsweise mittels BPMN oder aber UML Aktivitätsdiagrammen 
dargestellt wird, nicht von Relevanz, da jede dieser Modell zur Formalisierung 
des Kontrollflusses des Workflow-Graphen nutzt. 


Auch eine Rücktransformation von einem Workflow-Netz in das grafische Ab- 
laufmodell ist möglich. Voraussetzungen für die Übersetzungsregeln ist, dass 
es sich um ein sogenanntes free-choice Workflow-Netz handelt. In einem sol- 
chen Workflow-Netz haben je zwei beliebige Plätze entweder exakt die selbe 
Menge an Ausgangstransitionen, oder aber der Schnitt der Mengen der Aus- 
gangstransitionen beider Plätze ist leer [Esp17]. 


Dadurch gilt für jede erreichbare Markierung im Netz folgender Sachver- 
halt: Falls eine Ausgangstransition eines Platzes feuern kann, können auch 
alle anderen Ausgangstransitionen dieses Platzes feuern - es steht also frei 
zu entscheiden (engl. free choice), welche Ausgangstransition letztlich feuert 
[Esp17]. Diese Voraussetzung ist für die zur Modellierung der medizinischen 
Prozesse betrachteten block-strukturierten Prozessmodelle implizit gegeben. 


Ist das grafische Ablaufmodell in ein Workflow-Netz transformiert, kann die- 
ses in einem weiteren Transformationsschritt in einen Prozessbaum überführt 
werden [Zel20]. Auch hier ist eine Rücktransformation möglich. Aus dem so 
generierten Prozessbaum wird schließlich mittels der in dieser Arbeit entwi- 
ckelten Transformation ein FHIR-Plan erzeugt. 


Die Repräsentation als Prozessbaum kann weiterhin als Schnittstelle zum Feld 
des Process Minings gesehen werden. Ziel dieses Forschungsgebiets ist, ver- 
einfacht gesagt, das Herausschälen von implizitem Prozesswissen aus Daten, 
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Blockstrukturiertes 
grafisches Ablaufmodell 
(z.B. UML AD, BPMN) 


Hin- und Rück- 
transformation 
gemäß [Fav15] 


Workflow-Netze Hin- und Riick- 
transformation 
Beitrag dieser 
Arbeit 


Blockstrukturierte 
Workflow-Netze 


Prozessbäume 


Hin- und Rück- 
transformation 
gemäß [Zel20] 


Abbildung 4.2: Darstellung der Überführung eines im Expertendialog gewonnenen Ablaufmo- 
dells in die Wissensbasis in FHIR. Zunächst erfolgt die Überführung des UML 
Aktivitätsdiagramms - oder eines beliebigen anderen grafischen Prozessmodells 
- in ein Workflow-Netz, d.h. ein spezielles Petri-Netz. Dies erfolgt anhand der in 
[Fav15] beschriebenen Übersetzungsregeln. Das Workflow-Netz kann anschlie- 
Bend als Prozessbaum repräsentiert werden [Zel20]. Die anschließende Uberfith- 
rung eines Prozessbaums in einen FHIR-Plan ist ein Beitrag dieser Arbeit. Für 
alle drei Teilschritte ist auch eine Rücktransformation möglich, wenn bestimmte 
Einschränkungen an die Modelle gestellt werden“ 


° Hinweis: In der Abbildung wird aus Platzgründen der Begriff UML Aktivitätsdiagramm durch 
UML AD abgekürzt. 


die durch ein technisches System während der wiederholten Ausführung von 
Prozessinstanzen generiert wird und letztlich eine Sammlung an Ablaufpro- 
tokollen des Prozesses darstellt, sogenannte Event Logs [Aal16]. 


Während unterschiedliche Techniken zum Entdecken von Prozessen aus 
Event Logs existieren, gibt es eine Klasse von induktiven Methoden, die 
sogenannten Inductive Mining Verfahren [Lee13], die garantieren, dass die 
entdeckten Prozessmodelle zu den beobachteten Abläufen passen und zu- 
dem die wünschenswerte Eigenschaft der Soundness mit sich bringen, vgl. 
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4.2 Prozessbaum als Ausgangsmodell 


Kapitel 3.2.3. Dererlei Techniken basieren auf Prozessbäumen und liefern 
dementsprechend Prozessbäume als Ergebnis des Herausschälens zurück. 
Weiterhin gibt es interessante heuristische Methoden basierend auf geneti- 
schen Algorithmen, welche Prozessbäume aus Event Logs generieren [Buil2]. 
Weitere Technik wurden in den eigenen Beiträgen [Phi19c] und [Rom19] 
vorgestellt. Insbesondere im Feld der medizinischen Prozesse hat sich zudem 
gezeigt, dass sich speziell Prozessbäume gut eignen, um variierende Muster 
in Behandlungsprozessen aufzudecken [Kir18]. 


4.2 Prozessbaum als Ausgangsmodell 


Ausgangsbasis der Transformation sei ein Prozessbaum T = (X, Y) nach De- 
finition 3.4 mit Knotenmenge X und Kantenmenge Y. Die Knotenmenge X 
lasse sich weiter aufteilen in 


e A: die Menge der elementaren Aktionen (Teilmenge der Blattknoten), 
« J: die Menge der stillen Aktionen (Teilmenge der Blattknoten), 


e U: die Menge der Operatorknoten (Menge der inneren Knoten). 


Dabei gebe die Hilfsfunktion frp : U > {>,X, ^, O} für jeden Opera- 
torknoten seinen Typ zurück, also ob es sich bei dem betrachteten Opera- 
torknoten um einen sequentiellen, selektiven, nebenläufigen oder iterativen 
Verschaltungsoperator handelt. Da für einige Operatorknoten die Reihenfolge 
der Kinder relevant ist, ist der Prozessbaum T als ein sogenannter gepflanz- 
ter Baum [Hoc10] gegeben, bei dem an jedem inneren Knoten u € U eine 
Reihenfolge p(u) der direkten Nachfahren von u - also sprich: von dessen 
Kindern - vorgegeben ist. 


Basierend darauf sei eine partielle Hilfsfunktion fp,, : (UXX) > N gegeben, 
welche bei Eingabe eines Tupels bestehend aus einem Operatorknoten u € U 
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und einem weiteren Knoten x € X das Folgende zurückgibt: 


ae een, a 


lL, sonst 


Hierbei gebe r € N die Position des betrachteten Kindes x in der Reihenfol- 
ge p(u) der Kindknoten von u an’. Dies ist insbesondere für die Operatoren 
— und © von Interesse. Ist der Knoten x hingegen kein Kindknoten von u, 
existiert also keine Kante von u nach x, so wird durch die partielle Funktion 
kein Wert zugewiesen (Symbol L). 


Weiterhin sei der Prozessbaum als sogenannter knotenorientierter Baum ge- 
geben, bei dem Nutzdaten in jedem Knoten des Baumes abgelegt werden kön- 
nen [Fis18]. Folgende Nutzdaten können so im Baum abgelegt werden: 


e Inp(a) = {ig,...,ij} : In jedem Knoten a € A kann eine Liste aus 
l+ 1 €N Datenobjekten hinterlegt werden, welche während der Aus- 
führung von a als Eingabe benötigt werden. Die Elemente der Liste sind 
durch die Menge Inp(a) gegegeben. 


e Out(a) = {09;...,0x} : In einem Knoten a € A kann eine Liste aus 
k +1 € N Datenobjekten hinterlegt werden, welche während der Aus- 
führung von a als Ausgabe erzeugt werden. Die Elemente der Liste sind 
durch die Menge Out (a) gegegeben. 


Basierend darauf sei festgelegt: 


« Die Menge der Eingaben aller Aktionen: Bmp = LU Inp(a), 
acA 


« Die Menge der Ausgaben aller Aktionen: Bou = |) Out(a). 
acA 


* Hinweis: Das Symbol N bezeichnet die Menge der natürlichen Zahlen einschließlich der 0 (siehe 
Symbolverzeichnis ab Seite 209). 
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4.3 FHIR Plan als Zielmodell 


Ziel der Transformation sei ein FHIR Plan, welcher durch einen Graphen 
H = (K,M) mit Knotenmenge K und Kantenmenge M gegeben sei. Die 
Knotenmenge X lasse sich partitionieren in die folgenden disjunkten Kno- 
tenmengen: 


« J: Menge der elementaren Aktionen, 

« Jr: Menge der stillen Aktionen, 

e G_: Menge der gruppierenden Aktionen für Sequenzen, 

e G,: Menge der gruppierenden Aktionen für Entscheidungen, 

« G,: Menge der gruppierenden Aktionen für Nebenläufigkeiten, 
* Gœ: Menge der gruppierenden Aktionen für Iterationen, 

* Omp: Menge der Dateninputs, 


* Oout: Menge der Datenoutputs. 


Zudem beschreibe G = G_, U 9, U 9, U Go die Menge der gruppierenden 
Aktionen. Weiterhin sei die Menge der gerichteten Kanten gegeben durch: 


M ={(e;, ej) | (e;, ej) E (K \ (Omp U Oout)) x K, ej # ej} . 


Es existieren also keine Kanten ausgehend von Dateninputs oder Datenout- 
puts. Darüber hinaus gibt es keine Kanten von einem Knoten zurück in sich 
selbst - der Graph ist also frei von Schlingen (schlingenfrei). 


Die Kanten M können weiter unterschieden werden in: 


e Msn: Menge der Kanten, die gruppierende Aktionen mit ihren Subak- 
tionen verbinden, 


e Myo: Menge der Kanten, die repräsentieren, dass eine Aktion vor dem 
Ende einer anderen Aktion ausgeführt werden muss (before-end), 


e Myach: Menge der Kanten, die repräsentieren, dass eine Aktion nach 
dem Ende einer anderen Aktion ausgeführt werden muss (after-end), 
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e Mnp: Menge der Kanten, die Aktionen mit ihren zugehörigen Datenin- 
puts verbinden, 


e Mout: Menge der Kanten, die Aktionen mit ihren zugehörigen Daten- 
outputs verbinden. 


4.4 Transformation eines Prozessbaums in 
einen FHIR-Plan 


Zur Transformation eines Prozessbaums T = (X, Y) in einen FHIR-Plan 
H = (K,M) werde zunächst eine bijektive Funktion definiert, welche die 
Knoten des Prozessbaums auf eine Teilmenge der Knoten des FHIR-Plans 


abbildet: 

mas 1X >K \ (Omp U Oou) $ (4.2) 
Dabei sei die Menge der Dateninputs Omp und die Menge der Datenoutputs 
Oow nicht in der Zielmenge von fy, enthalten’. 
Aufgrund der Forderung nach Bijektivitat gilt nun: 


e fap ist injektiv, d.h. kein Element aus der Zielmenge wird mehrfach 
p J 8 
getroffen, 


* [Map ist surjektiv, d.h. jedes Element aus der Zielmenge wird getroffen, 


e es existiert eine Umkehrabbildung f Mipi d.h. die Funktion f map ist in- 
vertierbar. 


Mit der Funktion fmap werden jeder elementaren Aktion a € A, jeder stillen 
Aktion T € J und jedem Operatorknoten u € U des Prozessbaums eindeutig 


* Hinweis: Dateninputs und -outputs eines FHIR-Plans werden in einem späteren Teil dieses 
Abschnittes noch separat beleuchtet. 
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eine elementare Aktion j € J, eine stille Aktion j, € J, und eine gruppie- 
rende Aktion g € 9 des FHIR-Plans zugeordnet: 


jed, falls x € A 
Sp) =} jr EI, falsxeT . (4.3) 
geg, falls x € U 


Mithilfe von f Map werden die Knoten- und Kantenmengen des FHIR-Plans wie 
folgt gebildet: 


J ={ fmpla) la € A}, (4.4) 
Ir =ifmp TET}, (4.5) 
G> = friap) |U E U, fry) =>}, (4.6) 
Gx ={ fma) |U E U, fryplu) = X}, (4.7) 
Ga =f Map) |u E U, fryu) = A}, (4.8) 

Go tip) U E U, fyplu)=0 3}, (4.9) 


M sub = { (f Map 1); fmtap(%2)) | {1 Xa} E X, (x1, X2) E Y}, ( 

Myar Ft (f Map(%2)> fF map(%1)) | x2 E X, x, € Palxz)}, ( 
Myach = { (f map %1); Fmap(%2)) | {1 Xa} E X, (4.12) 

Pa(xı) = Pa(x2) = { Xpa }, Styp(pa) =; ( 

fros(X2) = Fpos(%1) — 1}. ( 


Dabei ist die Menge der elementaren Aktionen J des FHIR-Plans durch das 
Anwenden der bijektiven Funktion fmap auf die Aktionen A des Prozess- 
baums gegeben (4.4). Weiterhin ist die Menge der stillen Aktionen J, im FHIR- 
Plan durch das Bild der stillen Aktionen J des Prozessbaums festgelegt (4.5). 


In (4.6) - (4.9) werden die Mengen der gruppierenden Aktionen 9 des FHIR- 
Plans durch Anwenden von fy.p auf die entsprechenden Operatorknoten des 
Prozessbaums erzeugt. Dies geschieht jeweils für sequentielle, selektive, ne- 
benläufige sowie iterative Verschaltungen. 
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Die Kanten Msup, welche im FHIR-Plan die Aktionen mit ihren Subaktionen 
verbinden, werden in (4.10) erstellt. Dafür werden Kanten zwischen jenen Bil- 
dern fiap(Xı) und fiap(X2) gezogen, deren Urbilder x, und x, im Prozess- 
baum ebenfalls verbunden waren. Sprich: Auch die Bilder adjazenter Knoten 
bleiben adjazent. 


Wie später noch wichtig werden wird, handelt es sich bei der Transformati- 
on (4.4)-(4.10) um einen Graphen-Homomorphismus. Gleichzeitig wird aber 
gezeigt werden, dass sich sämtliche weitere Konstrukte in deterministische 
Weise aus dem Prozessbaum gewinnen lassen und lediglich die Eigenheiten 
der Repräsentation des FHIR-Plans widerspiegeln. Zu diesen Eigenheiten ge- 
hört beispielsweise, dass im FHIR-Plan neben der Kantenmenge Msup zusatz- 
lich weitere Kantenmengen benötigt werden. Diese Mengen und weitere Kon- 
strukte werden in den folgenden Absätzen bis Seite 92 beschrieben. 


In (4.11) werden die Kanten Myo erzeugt, die repräsentieren, dass eine Aktion 
vor Beendigung einer anderen ausgeführt werden muss. Im FHIR-Plan wer- 
den hierzu Kanten zwischen den Bildern fmap(X2) und fmap(X1) zweier Kno- 
ten x, und x, des Prozessbaums gezogen. Hierbei kann x, ein Aktions- oder 
Operatorknoten des Prozessbaums sein. Weiterhin muss im Prozessbaum xı 
Elternteil von x, gewesen sein, womit implizit folgt, dass x; ein Operatorkno- 
ten des Prozessbaums ist. Die Kanten in Myo verlaufen gerade in entgegen- 
gesetzter Richtung der Kanten in Ms,p. Obwohl diese Kanten auf den ersten 
Blick redundant erscheinen mögen, sind diese allerdings notwendig um eine 
sinnvolle FHIR-Repräsentation zu erhalten. 


Die Kanten Myach, die im FHIR-Plan repräsentieren, dass eine Aktion nach 
dem Ende einer anderen Aktion ausgeführt werden muss, werden in (4.12) 
- (4.14) erstellt. Dazu werden Kanten zwischen den Bildern fyyap(x1) und 
JMap(X2) zweier Knoten xı und x, des Prozessbaums erstellt. Damit eine 
Kante im FHIR-Plan notwendig wird, müssen die Knoten x, und x, im 
Prozessbaum einen gemeinsamen Elternknoten besitzen. Dieser muss vom 
Typ eines sequentiellen Verschaltungsoperators sein (4.13) - repräsentiert 
wird dies durch das Symbol —. Zudem spielt die Reihenfolge der Kinder des 
sequentiellen Verschaltungsoperators eine Rolle, was in (4.14) berücksichtigt 
wird: Sind x, und x, im Prozessbaum benachbarte Kinder und liegt x, rechts 
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von x3, so wird im FHIR Plan eine Kante zwischen den Bildern fmap(x1) und 
SMap(X2) erstellt. 


Zur Vervollständigung der Transformation sei weiterhin eine zweite bijektive 
Funktion 


f Map, Dat * (Binp U Bout) = (Otnp U Oout) (4.15) 


gegeben, welche die Menge aller Ein- und Ausgabe-Datenobjekte des Pro- 
zessbaums eindeutig auf die Menge aller Dateninputs und Datenoutputs des 
FHIR-Plans abbildet: 


Ommp E Omp > falls x € Binp 


Í Map, Dat(X) = (4.16) 


Oout € Oout > falls x € Bout 


Mithilfe von f Map, Dat(¥) lassen sich nun noch die folgenden Knoten- und Kan- 
tenmengen des FHIR-Plans erzeugen: 


Omp ={ f map, DaB) |b E Brp}, (4.17) 
Oout ={ f Map, Db) |b E Bou}, (4.18) 
M inp ={ (f Map, Datla), fap, dat(b)) |a € A, b € Inp(a)}, (4.19) 
Mout ={ (F map, Datla), fap, Dt b)) |a E A, b E Out(a)}. (4.20) 


Hierbei wird in (4.17) und (4.18) für jedes Datenelement aus dem Prozess- 
baum ein entsprechender Dateninput oder -output im FHIR-Plan erstellt. Da 
die Funktion fuap, pat bijektiv ist, gibt es jeweils eine eindeutige Zuordnung 
zwischen den Mengen Bmp und Boy, des Prozessbaums und den Mengen Omp 
und Oou des FHIR-Plans. 


In (4.19) und (4.20) werden anschließend noch die Kanten erstellt, welche die 
Dateninputs und die Datenoutputs mit den zugehörigen Aktionen j € J im 
FHIR-Plan verbinden. Dabei wird zwischen einer Aktion j = fap, Dat(@) so- 
wie einem Dateninput oder aber Datenoutput fap, par(b) dann eine Kante 
gezogen, wenn das Urbild b im Prozessbaum ein der Aktion a € A zugeord- 
netes Datenelement der Eingabe oder aber der Ausgabe war. 
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4 Transformationen zwischen Prozessbäumen und FHIR Plänen 


4.5 Transformation eines FHIR-Plans in einen 
Prozessbaum 


Zur Transformation eines FHIR-Plans H = (K,M) in einen Prozessbaum 
T = (X, Y) wird auf die Umkehrfunktion der in (4.2) und (4.3) definierten 
bijektiven Funktion fyap zurückgegriffen: 


Fitap © (K \ (Omp U Oou) > X. (4.21) 


Die Funktion bildet eine Teilmenge der Knoten des FHIR-Plans - alle Knoten 
außer den Dateninputs und Datenoutputs - auf die Knoten des Prozessbaums 


ab: 


aeA, falskedI 
Fap TET, Bllsked, (4.22) 
ucu, falskeg 


Mithilfe von f yes werden die Knoten- und Kantenmengen des Prozessbaums 


wie folgt gebildet: 


A ={ fup) lj EJ}, (4.23) 
T ={ fme) lje € Ie}, (4.24) 
U ={ fmap(g) |g ES} (4.25) 
Y ={ (S iip), fmap(%2)) | 1, x2) € Meus }- (4.26) 


Alle elementaren Aktionen j € J des FHIR-Plans werden dabei in die Aktio- 
nena € A des Prozessbaums übersetzt (4.23). Die stillen Aktionen j; € J; des 
FHIR-Plans werden analog auf die stillen Aktionen t € J des Prozessbaums 
abgebildet (4.24). Auch zwischen der Menge der gruppierenden Aktionen 9 
des FHIR-Plans und der Menge der Operatorknoten U des Prozessbaums be- 
steht eine Eins-zu-Eins-Beziehung (4.25). 


In (4.26) wird die Kantenmenge Y des Prozessbaums erzeugt: Für jede Kante, 
die im FHIR-Plan eine Aktion mit ihren Subaktionen verbindet wird auch im 
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4.5 Transformation eines FHIR-Plans in einen Prozessbaum 


Prozessbaum eine Kante zwischen den entsprechenden Bildern dieser Aktion 
und ihrer Subaktionen hinzugefügt. 


Weiterhin werde für die Operatorknoten des Prozessbaums der entsprechende 
Typ gesetzt: 


, fallsge 9, 


oe 
A,  fallsgeEG, 


Sayp Cf map(8)) = (4.27) 


x, falls g E 9, 
©, fallsg € Go 


Zum Schluss werden noch die in den Knoten des Baums gespeicherten Da- 
tenelemente erzeugt. Hierzu wird auf die Umkehrabbildung der in (4.15) und 
(4.16) definierten Funktion fap, Dat zurückgegriffen: 


Tics Dat ` (Otnp U Oou) B (Binp U Bout) E (4.28) 


Die Funktion bildet die Mengen aller Dateninputs und Datenoutputs des 
FHIR-Plans eindeutig auf die Mengen aller Datenobjekte der Eingabe und 
Ausgabe des Prozessbaums ab: 


Dinp E Binp > falls k € Omp 


(4.29) 
bout E Bout 3 falls k E Oout 


Siia, Dat K) = 


Mithilfe von f Man. Dat Können nun die Datenobjekte des Prozessbaums erzeugt 
und für jede Aktion a in die Mengen der Eingabelemente Inp (a) und der Aus- 
gabelemente Out (a) zusammengefasst werden: 


Va E A, a= Tira, pat) : 
Inp (a) = ener Dat(0) | (0, KD) E M,0 € Oinp }, (4.30) 
Out (a) = Ef iip, Dat(0) | (j, 0) E M, oE Oout } x (4.31) 
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4 Transformationen zwischen Prozessbäumen und FHIR Plänen 


4.6 Erhaltung der Struktur der 
Originalmodelle 


Die Transformation eines Modells in eine alternative Repräsentation sollte 
dessen Struktur so gut wie möglich erhalten, damit anschließend eine ver- 
lustfreie Rücktransformation möglich ist. 


In diesem Kapitel wird daher untersucht, inwiefern die beschriebenen Trans- 
formationen die Struktur der Ursprungsmodelle erhalten. Da Ausgangs- und 
Zielmodelle jeweils als Graphen dargestellt werden können, wird in einem 
ersten Schritt überprüft, welche Eigenschaften die Abbildung des einen Gra- 
phen in den anderen Graphen aufweist. In diesem Kontext werden Graph- 
Homomorphismen und -Isomorphismen als spezielle, strukturerhaltende Ab- 
bildungen zwischen Graphen definiert. 


4.6.1 Strukturerhaltung bei Hintransformation 


Bei der Hintransformation wird ausgehend von einem Prozessbaum 
T = (X, Y) ein FHIR-Plan H = (K, M) erzeugt. Im Rahmen dieser Transfor- 
mation wird zunächst die Knotenmenge X des Prozessbaums mithilfe der in 
4.2 definierten bijektiven Funktion fmap in die Knotenmenge des FHIR-Plans 
abgebildet: 


Ff Map X> K \ (Oinp U Oout) . (4.32) 


Dabei umfasst der Bildbereich von f map nur eine Teilmenge der Knotenmenge 
des FHIR-Plans - alle Knoten außer den Dateninputs und den Datenoutputs. 
Die weitere Betrachtung fokussiert sich daher auf den Kontrollfluss. 


Durch fmap wird gemäß (4.3) jeder Operatorknoten des Prozessbaums ein- 
deutig auf eine gruppierende Aktion des FHIR-Plans abgebildet. Gleichzeitig 
wird ebenso jede Aktion des Prozessbaums - sei es eine elementare oder stille 
Aktion - eindeutig auf eine entsprechende Aktion des FHIR-Plans abgebildet. 
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Damit diese Transformation strukturerhaltend ist, müssen die Eltern-Kind- 
Beziehungen des Prozessbaums T auch im Graphen des FHIR-Plans H zu fin- 
den sein. Elternknoten im Prozessbaum sind gemäß Definition immer Opera- 
torknoten (vgl. Kapitel 3.4). Betrachtet man einen beliebigen Operatorknoten 
u € Udes Prozessbaums, so sind ihm diverse Kindknoten x € X zugeordnet, 
die jeweils über eine Kante aus der Kantenmenge Y des Prozessbaums mit 
dem Operatorknoten u verbunden sind: 


Chi(u) = {x EX | A(u, x) E€ Y}. (4.33) 


Zur Erhaltung der Eltern-Kind-Beziehung muss fiir einen beliebigen Opera- 
torknoten u € U des Prozessbaums, sowie dessen Kinder x gelten: 


Vx E€ X, Yu E U : x E Chiu) > fmap(¥) E Chi (fmap(u)). (4.34) 


Die transformierten Kindknoten von u müssen also im FHIR-Plan wiederum 
Kindknoten des Bildes f mapu) sein. Dabei kann die Menge der transformier- 
ten Kindknoten {fuap(X) | x € X} auch nur eine Teilmenge der Kindknoten 
von f mapu) ausmachen: 


Fra) |X © X} C Chi (fra). (4.35) 


Zur Prüfung des Sachverhalts (4.34) sind insbesondere die Kanten Msup des 
FHIR-Plans von Interesse, da diese im FHIR-Plan Eltern-Kind-Beziehungen 
zwischen Aktionen und ihren Subaktionen repräsentieren. Die Kantenmenge 
Ms, wird unter Anwendung der Funktion f map erzeugt, indem zwischen den 
Bildern zweier adjazenter Knoten eine Kante gezogen wird: 


M sub a { Cf Map(%1), Ff Map(%2)) | X1, X2 € X, (X1, X2) E Y} > (4.36) 


Dass Aussage (4.34) für die in (4.4) - (4.14) definierte Transformation gilt, wird 
im Folgenden bewiesen: 


e Gegeben seien zwei Knoten x € X und u € U des Prozessbaums mit 
x € Chi(u). Nach Voraussetzung existieren dann Kanten (u, x) € Y, 
vgl. (4.33). 
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Weiterhin gilt, dass der Definitionsbereich der Funktion fmap ganz U 
umfasst, vgl. (4.32), und fmap bijektiv ist. Demnach existiert zu jedem 
u € Uein eindeutiges Bild f mapu) € K in der Knotenmenge des FHIR- 
Plans. 


Da fap die Operatorknoten des Prozessbaums auf die Menge der grup- 
pierenden Aktionen G C K abbildet, vgl. (4.3), existiert genauer zu je- 
dem u € U auch ein eindeutiges g = f mapu) € 9. 


Da fap zudem die Knoten für Aktionen und stille Aktionen des Pro- 
zessbaums eindeutig auf die Menge der elementaren und stillen Aktio- 
nen J und J, des FHIR-Plans abbildet, vgl. (4.3), existiert allgemein zu 
jedem Kind x von u, d.h. zu jedem x € Chi(u), auch ein eindeutiges 
Bild k = fmx) E K. 


Nun ist noch zu zeigen, dass die Bilder der Kindknoten k = f\ap(x) 
auch im FHIR-Plan durch Kanten mit den Bildern der Elternknoten 
& = fMap(u) verbunden sind. 


Bei der Transformation wird die Kantenmenge Ms, des FHIR- 
Plans gemäß (4.36) gebildet. Demnach sind zwei Knoten des FHIR- 
Plans durch eine Kante verbunden, sofern auch deren Urbilder im 
Prozessbaum adjazent sind. Da (u,x) € Y, d. h. u und x im Pro- 
zessbaum adjazent sind, existiert auch im FHIR-Plan eine Kante 
(g.k) = (f maplt), Fmap(X)) E Msup für alle Paare aus Elternknoten u 
und Kindknoten x des Prozessbaums. 


Existiert nun eine Kante von einem Knoten g zu einem Knoten k 
des FHIR-Plans, so ist dies genau die Definition einer Eltern-Kind- 


Beziehung. Es gilt also: k = fmap(x) € Chi(g) = Chi (f Map(u)). 


Letztlich lässt sich feststellen, dass es sich bei der in (4.4) - (4.14) gegebe- 
nen Transformation eines Prozessbaums in einen FHIR-Plan um einen so- 


genannten Graphen-Homomorphismus handelt. Graphen-Homomorphismen 
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sind spezielle, strukturerhaltende Abbildungen zwischen Graphen’. Existiert 
jeweils eine solche strukturerhaltende Abbildungen für die Hin- und die Rück- 
richtung der Transformation zwischen zwei Graphen, dann nennen sich die 
beiden Graphen homomorph-äquivalent. 


Ein Graphen-Homomorphismus kann dabei wie folgt definiert werden 
[Kna15]: 


Gegeben seien zwei Graphen G) = (V, E1) und G, = (V, E) mit den 
Knotenmengen V, und V, sowie den Kantenmengen E und €). Eine 
Abbildung from : Vj > V, (auch from : Gy; > G2 geschrieben?) heißt 


Graphen-Homomorphismus’, wenn sie kantenerhaltend ist, d.h. wenn gilt 


Yx, y E V : (x,y) E E > (FHom(&), ftom) E E2. (4.37) 


Zwischen den Bildern zweier im Ursprungsgraphen adjazenter Knoten wird 
im Zielgraph also auch immer eine Kante gezogen. Durch diese Forderung in- 
duziert ein Graphen-Homomorphismus fpom letztlich auch immer eine Ab- 
bildung zwischen den Kantenmengen des Ursprungs- und des Zielgraphen, 
Som, Kanten : E1 > E2, sodass — vereinfacht gesagt — das Folgende gilt: Durch 
einen Homomorphismus werden Kanten auf Kanten abgebildet. 


Da die Kantenmenge des Prozessbaums lediglich durch Eltern-Kind- 
Beziehungen gegeben ist und diese wie oben gezeigt vollständig in die 
Kantenmenge Msup des Prozessbaums abgebildet werden, ist die Transfor- 
mation von dem Prozessbaum in den FHIR-Plan also ein strukturerhaltender 
Homomorphismus. 


Hinweis: Strukturerhaltende Abbildungen zwischen mathematischen Strukturen werden allge- 
mein als Homomorphismen bezeichnet. Die Homomorphismen der Vektorräume sind besipi- 
elsweise die linearen Abbildungen. 

Hinweis: Da die Abbildung zwischen den Knotenmengen der beiden Graphen gemeinsam mit 
der Forderung nach Kantenerhaltung letztlich auch eine Abbildung zwischen den beiden Kan- 
tenmengen induziert, spricht man bei einem Graphen-Homomorphismus ‚fHom auch von einer 
Abbildung zwischen zwei Graphen. Man kann den Homomorphismus dann auch als Abbil- 
dung zwischen den disjunkten Vereinigungen der Knoten- und Kantenmengen der Graphen 
definieren: fom : (Vı + €1) > (V2 + £2), vgl. z.B. [Tin76]. 

Hinweis: Wird teils auch als Graphen-Morphismus bezeichnet. 


» 


w 
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4 Transformationen zwischen Prozessbäumen und FHIR Plänen 


Betrachtet man einen Teilgraphen' des FHIR-Plans, kann sogar gezeigt wer- 
den, dass der Teilgraph und der Prozessbaum isomorph sind, d.h. ein soge- 
nannter Graphen-Isomorphismus existiert. Ein Graphen-Isomorphismus un- 
terscheidet sich von einem Graphen-Homomorphismus dadurch, dass zusätz- 
lich Bijektivität gefordert wird, sprich: Auch die Abbildung in umgekehrter 
Richtung - also vom Zielgraphen wieder zurück in den Ursprungsgraphen - 
muss ein Graphen-Homomorphismus sein. 


Dadurch folgt für die vom Isomorphismus induzierte Abbildung from, Kanten 
zwischen den Kantenmengen der beiden Graphen die Surjektivität: Ist eine 
Kante im Zielgraphen vorhanden, so muss es im Ursprungsgraphen ein ent- 
sprechendes Urbild dieser Kante gegeben haben. 


Dementsprechend gilt bei einem Graphen-Isomorphismus fts : Vj > V: 


Yx, y E V : (x,y) E E > (Sfiso(X), fisoY)) E E>. (4.38) 


Betrachtet man einen Teilgraphen H = (K, MT) des FHIR-Plans mit der Kno- 
tenmenge K = (K \ (Omp U Oout)) und der Kantenmenge Msup, sind T und H 
isomorph und f map ist ein Graphenisomorphismus. Hierauf wird im nächsten 
Kapitel 4.6.2, bei der Untersuchung der Strukturerhaltung bei Rücktransfor- 
mation, aufgebaut. 


Weiter ist nun zu zeigen, dass sich auch die noch fehlenden Knoten und Kan- 
ten des FHIR-Plans eindeutig aus dem Prozessbaum und dem schon erzeugten 
Teilgraphen A ableiten lassen. 


Zunächst werden die Kanten My,, betrachtet. Diese Kanten repräsentieren, 
dass eine Aktion vor dem Ende einer anderen Aktion ausgeführt werden muss. 
Da diese Kanten im Falle des FHIR-Plans immer in umgekehrter Richtung der 
Kanten Msu verlaufen, können sie leicht erstellt werden, indem der Teilgraph 
A transponiert wird. Hierdurch wird der Graph HT mit gleicher Knotenmen- 
ge K, aber angepasster Kantenmenge erzeugt. Letztere wird gebildet, indem 


1 Hinweis: Ein Teilgraph entsteht aus einem Graphen, indem Knoten und/oder Kanten entfernt 
werden. 
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alle Kanten der Menge Msup umgekehrt werden, wodurch die neue Kanten- 
menge gerade der Menge Myer entspricht. Anschließend kann dann die Verei- 
nigung der beiden Teilgraphen HUA” gebildet werden. Resultat ist ein Graph, 
welcher aus der Knotenmenge K, sowie der Kantenmenge (Msup U Myo,) be- 
steht. 


Das Bilden der Kantenmenge Myach gemäß (4.12) - (4.14) ist anspruchsvoller. 
Hierbei muss zum Einen der Typ des jeweiligen Operatorknotens vorliegen, 
da dererlei Kanten nur zwischen Kindknoten des sequentiellen Verschaltungs- 
operators erzeugt werden müssen. Zum Anderen muss auch die Reihenfolge 
der Kindknoten bekannt sein, da diese bei der Verschaltung von Relevanz ist 
und bestimmt, welche Kindknoten im FHIR-Plan adjazent sind. 


Letztlich sind diese beiden Informationen aber eindeutig durch den Prozess- 
baum vorgegeben. Jedem Elternknoten kann gemäß der Funktion f7,, : U > 
{>, X, A, O } eindeutig einer der vier Operatortypen zugeordnet werden. Wei- 
terhin ist auch eine eindeutige Reihenfolge der Kindknoten gegeben und be- 
kannt, da es sich bei einem Prozessbaum wie in Kapitel 4.2 beschrieben um 
einen gepflanzten Baum handelt. 


4.6.2 Strukturerhaltung bei Rücktransformation 


Bei der Rücktransformation wird ausgehend von einem FHIR-PlanH = (K, M) 
ein Prozessbaum T = (X, Y) erzeugt. Hierfür wird zunächst eine Teilmenge 
der Knoten des FHIR-Plans in die Knotenmenge des Prozessbaums abgebildet. 
Dies geschieht mithilfe der in 4.21 Umkehrfunktion zu fap : 


Fra = (X \ (Omp U Oow) > X. (4.39) 


Dabei umfasst der Definitionsbereich von fmap alle Knoten des FHIR-Plans, 
außer den Dateninputs und den Datenoutputs, welche später gesondert be- 
trachtet werden. Durch diese Einschränkung auf eine Teilknotenmenge des 
FHIR-Plans, ist die Abbildung fmap bijektiv und die Umkehrabbildung f ve 
kann gebildet werden. Demnach ist die Funktion f Map auch surjektiv, d.h. je- 
des Element aus der Knotenmenge X des Prozessbaums wird getroffen. 
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Wie im vorherigen Kapitel gezeigt, sind sowohl die Abbildung fy.) als auch 
f Map Graphen-Homomorphismen bezüglich des Graphens des Prozessbaums 
T und des Teilgraphens H des FHIR-Plans. Ä besteht dabei aus der Knoten- 
menge K = (K \ (Omp U Oout )) und der Kantenmenge Msup. Somit existiert 
ein Graphen-Isomorphismus und damit jeweils strukturerhaltende Hin- und 
Rücktransformationen zwischen den beiden Graphen. 


Um die Datenelemente zu erzeugen, die in den Knoten des Prozessbaums ge- 
speichert werden, wird die in (4.29) definierte Funktion f Map, Dat genutzt. Da 


diese wiederum bijektiv ist, ist eine eindeutige Rücktransformation aus den 
Knoten des FHIR-Plans möglich. 
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5 Assistenz bei chirurgischen 
Interventionen 


In der modernen Medizin wird der Einsatz computergestützter Assistenz im- 
mer wichtiger, vgl. [Phi16b, Lal14]. So wird der weltweite Markt für medizi- 
nische Robotik und computergestützte chirurgische Ausrüstung bis 2025 auf 
umgerechnet 9,6 Milliarden Euro anwachsen (bei einer fünfjährigen durch- 
schnittlichen jährlichen Wachstumsrate von 13,5%) [McW20]. 


Im Rahmen der Computerassistierten Chirurgie (engl. Computer Assisted 
Surgery) (CAS) können Assistenzfunktionen umgesetzt werden, die Ent- 
scheidungsunterstützungen für Mediziner [Ken15] bereitstellen. Eine solche 
Entscheidungsunterstützung eröffnet Optimierungspotentiale hinsichtlich 
der Vermeidung falscher Behandlungen beispielsweise durch Verhinderung 
oder Vermeidung von Flüchtigkeitsfehlern sowie Irrtümern. 


In diesem Zusammenhang spielt die chirurgische Phasenerkennung eine 
wichtige Rolle: Erst durch die Beurteilung des Verlaufs einer laufenden 
Operation ist eine maßgeschneiderte (d.h. kontextsensitive) und interaktive 
Entscheidungsunterstützung während eines chirurgischen Eingriffs mög- 
lich. Dabei findet nicht nur eine passive Verbreitung (z.B. Verbreitung über 
Printmedien) von Hilfsmitteln (z.B. medizinische Leitlinien) statt, die nur 
geringe Auswirkungen auf das tatsächliche Behandlungsverhalten hat [Fie92, 
Stell]. Darüber hinaus erlaubt eine maßgeschneiderte Entscheidungshilfe 
die Filterung tatsächlich verfügbarer Informationen, um operativ effektiv 
zu sein, indem sie eine Informationsüberflutung von Ärztinnen und Ärzten 
verhindert [Joy83, Kra13, Lin13]. 
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Die Optimierung eines Arbeitsablaufs, z. B. durch den Vergleich aufgezeichne- 
ter Daten mit einem vordefinierten Zielmodell, ist ein weiteres Anwendungs- 
beispiel für eine Phasenerkennung. Dies ist besonders relevant, da Operatio- 
nen als eine wichtige Quelle für die Verbesserung der Effizienz des Kranken- 
hauses [Her03] identifiziert werden konnten. 


Chirurgische Interventionen lassen sich neben der Dringlichkeit, den betrof- 
fene Körperstellen, dem Zweck auch nach der sogenannten Invasivität eintei- 
len. Während bei der minimal-invasiven Chirurgie nur über kleine, künstlich 
geschaffene Öffnungen in den Körper vorgedrungen wird, sind bei der of- 
fenen Chirurgie weitreichendere (invasivere) Methoden notwendig, um das 
Operationsgebiet, den sogenannten Situs, geeignet zu eröffnen und für eine 
Behandlung darzustellen [Psc13]. 


Im folgenden Kapitel 5.1 wird je ein prototypischer Vertreter des minimal- 
invasiven und des offenen Ansatzes erläutert. In Kapitel 5.2 werden die den 
beiden Ansätzen zugrunde liegenden Konstituenten des Problems betrachtet 
und darauf aufbauend in Kapitel 5.3 bereits bekannte Lösungsansätze beleuch- 
tet. Die eigenen Beiträge zur Erweiterung des Standes der Technik werden in 
den daran anschließenden Kapiteln ausführlich dargestellt. 


5.1 Medizinischer Hintergrund 


In den folgenden beiden Kapiteln 5.1.1 und 5.1.2 werden die medizinischen 
Grundlagen zum Verständnis der Versorgung von Patienten mit einem künst- 
lichen Hüftgelenk sowie der chirurgischen Entfernung der Gallenblase erläu- 
tert. Diese Eingriffe sind prototypische Vertreter für eine Vielzahl anderer Ein- 
griffe im medizinischen Bereich. 
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5.1.1 Totale Endoprothese der Hüfte 


Die endoprothetische Versorgung eines Patienten mittels einer totalen En- 
doprothese (TEP) der Hüfte, auch kurz Hüft-TEP' genannt, ist ein Eingriff, 
bei dem das Hüftgelenk des Menschen vollständig (= total) durch eine Pro- 
these, also ein künstliches Hüftgelenk, ersetzt wird?. Diese Prothese wird in 
den Menschen eingebracht (= endo, innen) und verbleibt dort also sogenann- 
te Endoprothese. Gründe für eine solche endoprohetische Versorgung sind 
beispielsweise eine fortgeschrittene Hüftgelenksarthrose oder der Bruch des 
Oberschenkelhalses [Fre06, Lür17]. 


Mit über die Jahren steigenden Fallzahlen’ ist sie aktuell mit etwa 240.000 Ein- 
griffen pro Jahr in Deutschland eine sehr häufige Versorgungsmaßnahme in 
Krankenhäusern. Auch international ist Deutschland verglichen mit anderen 
OECD Ländern, Spitzenreiter bei der Implantation künstlicher Hüftgelenke 
[OEC19]. Werden solcherlei Eingriffe geeignet technisch unterstützt (vgl. Ka- 
pitel 5), so ist zu erwarten, dass dies einen Einfluss auf eine Vielzahl an Pati- 
enten und ärztlichem Personal haben wird. 


Auch wenn es mehrere, gleichermaßen erprobte, Zugangswege im Rahmen 
des Eingriffs gibt [Nog17, Lür17], kann der Zugang nach Bauer [Bau79] durch 
den Glutealmuskel (Gesäßmuskel) als eine der etablierten Vorgehensweisen in 
Deutschland angesehen werden. Für das standardisierte Vorgehen kann ein 
Soll-Operationsverlauf aufgestellt werden, der teils in entsprechenden Hand- 
büchern beschrieben und mit zusätzlichem Erfahrungswissen der Experten, 
auch über einzelne Fallbeispiele, angereichert wird, vgl. [Lür17]. 


Dieser Soll-Operationsverlauf ist aufgrund der standardisierten Vorgehens- 
weise zwischen Personen und Krankenhäusern zunächst einmal übertragbar. 
Ähnlich wie bei der Thematik der medizinischen Leitlinien [Phi15b, Phil5c, 


* Hinweis: Der Begriff TEP findet auch bei anderen Körperstrukturen Anwendung. Beispielswei- 
se wird bei Ersetzung des Kniegelenkes von einer Knie-TEP gesprochen. 

? Hinweis: Der Mensch verfügt über ein rechtes und ein linkes Hüftgelenk. Egal ob das rech- 
te oder aber das linke Hüftgelenk ersetzt wird, wird gleichermaßen von einer Hüft-TEP 
gesprochen. 

® Hinweis: Im Jahr 2005 bzw. 2018 wurden 194.453 bzw. 239.204 Eingriffe vorgenommen [Sta19a]. 
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Abbildung 5.1: Lagerung eines Patienten auf dem Rücken zur Durchführung einer endopro- 
thetischen Versorgung mittels Hüft-TEP mit Zugang nach Bauer [Bau79]. Der 
Zugang erfolgt (siehe rote Markierung) durch schichtweises Freilegen des Hüft- 
gelenks direkt lateral (seitlich) und transgluteal (durch den Glutealmuskel). In 
Anlehnung an [Lür17]. 


Phil6a, Phil6b] sollen die Vorgehensweisen aber durch Experten entspre- 
chend den Rahmenbedingungen (beispielsweise Ausstattung des betreffenden 
Krankenhauses) angepasst und fallspezifisch interpretiert werden. 


Einen stark vereinfachten Überblick der endoprothetischen Versorgung mit 
einer Hüft-TEP nach Bauer [Bau79] zeigen die Abbildungen 5.1, 5.2 und 5.3. 
Zunächst wird am rechten Bein ein Hautschnitt lateral’, also seitlich des Bei- 
nes, durchgeführt (siehe rote Markierung in Abbildung 5.1)’. 


Der Zugangsweg zum rechten Hüftgelenk erfolgt dann durch schichtweises 
Freipräparieren. Dies geschieht direkt, also durch den dort liegenden Glute- 
almuskel hindurch (transgluteal). Die Vorgehensweise wird deswegen teils 
bezeichnet als (vgl. [Nog17]): direkter lateraler, transglutealer Zugang nach 
Bauer. 


Wie in Abbildung 5.1 und 5.2 dargestellt, besteht der Bereich von Interesse 
aus: 


1 lat. latus = Flanke, Seite 

2 Hinweis: In dieser Ausarbeitung werden jene anatomische Lagebezeichunngen verwendet, die 
invariant bezüglich der Positionierung des Patienten sind. Beispielsweise kranial (schädelwärts) 
statt superior (oben). Letzteres unterscheidet sich bei einem stehenden und einem liegenden 
Patienten. 
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Abbildung 5.2: Stark vereinfachte, skizzenhafte Darstellung der endoprothetischen Versorgung 
mit einer Hüft-TEP in Anlehnung an [Fre06]. Zunächst wird der Schenkelhals 
(hellgrau) mit einer Säge durchtrennt um den Hüftkopf (grün) entfernen zu kön- 
nen (0). Danach wird die Hüftpfanne mit einer kügelförmigen, rotierenden, elek- 
trischen Fräse bearbeitet (1). In die Fräsung wird die künstliche Pfanne hin- 
eingeschlagen (2). Schließlich wird der Markraum des Oberschenkelknochens 
freipräpariert (3), der künstliche Schaft eingebracht (4), der künstliche Hüftkopf 
aufgesetzt sowie schließlich Kopf und Pfanne reponiert, also das nun künstliche 
Gelenk eingerenkt (5). 


e dem Oberschenkelknochen (dunkelgraue Struktur), 
« dem Schenkelhals (hellgrauer Bereich), 
e dem Hüftkopf (grüner Bereich), 


+ dem Hüftpfanne bzw. Becken (schwarzer Bereich). 


Um den Hüftkopf entfernen zu können, muss zunächst die Gelenkkapsel frei- 
präpariert werden. Danach wird bei der sogenannten Schenkelhalsosteoto- 
mie’ der Schenkelhals mit einer Säge durchtrennt, vgl. (0) in Abbildung 5.2. 
Der Hüftkopf kann dann mit einem Korkenzieherinstrument geborgen wer- 
den. Damit dies gelingen kann, muss nach der Präparation der Gelenkkap- 
sel aber vor der eigentlichen Schenkelhalsosteotomie das Hüftgelenkt luxiert, 
d.h. ausgekugelt werden. 


* Hinweis: Osteotomie bezeichnet allgemein das Durchtrennen von Knochen oder Entfernen von 
Knochenfragmenten. 
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Abbildung 5.3: Schematische Darstellung des ausgerenkten (luxierten) Hüftgelenks. Die Beine 
sind rechtwinklig zueinander, in der sogenannten Viererposition angeordnet. 
Der Schenkelhals ist mit einer hellgrauen Fläche markiert. Der Hals wird im 
Rahmen der Schenkelhalsosteotomie mit einer Säge durchtrennt um den darauf 
befindlichen Hüftkopf (grün) entfernen zu können. 


Nun wird die Hüftpfanne mit einer kügelförmigen Fräse ausgefräst, sowie da- 
nach die künstliche Hüftpfanne mit einem Einschlaginstrument und Hammer 
in den ausgefrästen Bereich hineingeschlagen - vgl. (1) und (2) in Abbildung 
5.2. Die Ausfräsung und künstliche Pfanne müssen dabei so zusammenpassen, 
dass Letztere beim Hineinschlagen fest (pressfit) sitzt [Lür17]. 


Danach wird bei der Schaftpräparation der schwammartige Markraum des 
Oberschenkelknochens (Femur) mit Hammer und Meißel eröffnet. Dies ge- 
schieht in der sogenannten Viererposition. 


Abbildung 5.3 zeigt eine Momentaufnahme, bei dem der Patient in der Vierer- 
position liegt, also durch die rechtwinklige Positionierung des Unterschenkels 
des betroffenen Beines auf dem Oberschenkel des anderen Beines der Ein- 
druck einer Vier entsteht. In Folge dieses Vorgehens sind bei dem Eingriff 
typische Positionswechsel der beteiligten Akteure zu beobachten. 


Dann wird der Markraum schrittweise, mit Raffeln (Raspeln) steigenden 
Durchmessers, freipräpariert (2). Ist die richtige Größe und Tiefe erreicht, 
verbleibt die letzte Raffel probeweise im Markraum (3) - sie wird mit einem 
künstlichen Hüftkopf versehen. Zur Probe wird dann das künstliche Gelenk 
eingerenkt, also der Hüftkopf und die Pfanne reponiert (5). Durch kontrol- 
lierte Bewegungen des Beines wird geprüft, ob die Bewegungsausmaße stabil 
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Tabelle 5.1: Zwei Momentaufnahmen eines prototypischen Operationssaales bei einer endopro- 
thetischen Versorgung mit einer Hüft-TEP. Der Patient P liegt auf dem Rücken auf 
dem Operationstisch. Operateur O, erster Assistent 1A, zweiter Assistent 2A und 
der Instrumentierende Istehen um den Tisch herum. Der Instrumentierende I reicht 
die Instrumente von Instrumentiertisch IT an die Kollegen weiter. In Anlehnung an 
[Phi16c, Sch16]. 


Operationssaal Sicht A Operationssaal Sicht B 


sind und letztlich ob von identischen Beinlängen ausgegangen werden kann 
[Lür17]. 


Schließlich wird die Raffel durch den Originalschaft mit Originalkopf ersetzt. 


Die Wunde am Bein wird danach verschlossen und ein Verband angelegt. 


Tabelle 5.1 zeigt zwei Skizzen eines prototypischen Operationssaales, in wel- 
chem die Operation stattfindet. Der Patient P liegt auf dem Rücken auf dem 
Operationstisch. 


Der Operateur O steht zu Beginn der Operation am Fußende des Tisches, 
flankiert vom ersten Assistenten 1A und dem Instrumentierenden I. Letzterer 
reicht die Instrumente vom Instrumentiertisch IT an seine Kollegen weiter. 
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Auf der gegenüberliegenden Seite des Tisches befindet sich der zweite Assis- 
tenz 2A, der während der Operation vorwiegend Haltearbeit verrichtet sowie 
bei der Positionierung des Patienten unterstützt (vgl. Abbildung 5.3). 


Aufsicht A der Tabelle 5.1 zeigt die Positionierung der Ärzte bis zur Pfan- 
nenpräparation — danach, mit Beginn der Schaftpräparation, wird der Pati- 
ent erstmals in Viererposition verbracht. Operateur O und erster Assistenz 
1A tauschen daraufhin die Plätze - somit hat O einen direkten Blick auf den 


Schaft. 


Anders als im Falle der minimalinvasiven Chirurgie (vgl. Kapitel 5.1.2), kann 
bei der technischen Erfassung des Operationsgeschehens der Hüft-TEP nach 
Bauer nicht auf vorhandene Sensorik zurückgegriffen werden, die bereits Be- 
standteil der Versorgung ist (beispielsweise Videoendoskop). 


Eine Möglichkeit zur Erfassung von Sensorwerten und daraus abgeleiteter 
Merkmale ist die Verwendung von Tiefenkameras, die an der Decke des Ope- 
rationssaales angebracht sind und Ärzte, Patient sowie Instrumente aus ver- 
schiedenen Perspektiven erfassen können [Phil6c, Sch16]. 


5.1.2 Laparoskopische Cholezystektomie 


Eine laparoskopische Cholezystektomie ist ein chirurgisches Verfahren zur 
Entfernung (Ektomie)' der Gallenblase (engl. Cholecyst). Ausgehend vom Jahr 
1882, in dem die erste Cholezystektomie noch am großflächig eröffneten Kör- 
per eines Menschen durchgeführt wurde [Tra76, Van86], hat sich die soge- 
nannte laparoskopische Cholezystektomie als Goldstandard der Gegenwart 


n 


Hinweis: Im deutschen Sprachraum wird zwischen den Begriffen Ektomie und Resektion unter- 
schieden. Ersteres bezeichnet ein (komplettes) Herausschneiden eines Organs, während Letz- 
teres eher im Sinne des Wegschneidens von Teilen oder aber auch ganzer Organe gebraucht 
wird. Der Übergang von Resektion zu Ektomie ist also in gewissem Sinne fließend. In dieser 
Ausarbeitung werden, unter dem Gesichtspunkt der medizinischen Anwendungsfälle, der Be- 
griff Ektomie als Entfernung und der Begriff Resektion als Abschneiden umschrieben. 
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entwickelt [McS89, W105]. Bei diesem Verfahren wird mit einer minimal- 
invasiven' Zugangsart ein Laparoskop, ein spezielles Endoskop zur Durch- 
führung einer Laparoskopie (= Bauchspiegelung), in den Körper des Patienten 
eingeführt. 


Ein typischer Grund für die Durchführung des Eingriffs sind Gallensteine, die 
bei den Patienten relevante Schmerzen verursachen [Pér94]. Durch den Ein- 
griff sollen diese Gallensteine einerseits entfernt werden, andererseits wird 
durch die Entnahme der gesamten Gallenblase die Neubildung weiterer Gal- 
lensteine verhindert. 


Die Cholezystektomie ist mit leicht rückläufigen Fallzahlen ein vergleichs- 
weise häufiger Eingriff an deutschen Krankenhäusern. Im Jahr 2016 wurden 
213.821 Eingriffe vorgenommen, im Jahr 2018 sank die Zahl leicht auf 198.942 
Operationen [Sta19b]. 


In 2018 war die Cholezystektomie damit auf Rang 11 der häufigsten Opera- 
tion in Deutschland [Sta19b]. Werden solcherlei Eingriffe geeignet technisch 
unterstützt (vgl. Kapitel 5), so ist zu erwarten, dass dies einen Einfluss auf eine 
Vielzahl an Patienten und ärztlichem Personal haben wird. 


Der Soll-Operationsverlauf der Cholezystektomie kann wegen der gut doku- 
mentierten und standardisierten Vorgehensweise [Stal4] zwischen Personen 
und Krankenhäusern übertragen werden. 


Ähnlich wie bei der Thematik der medizinischen Leitlinien [Phi15b, Phil5c, 
Phil6a, Phil6b] sollen die Vorgehensweisen aber durch Experten entspre- 
chend den Rahmenbedingungen (beispielsweise Ausstattung des betreffenden 
Krankenhauses) angepasst und fallspezifisch interpretiert werden. 


Abbildung 5.4 zeigt skizzenhaft und stark vereinfacht die anatomische Lage 
der Gallenblase, der Leber sowie des Magens. Für den Eingriff wird zunächst 
die Bauchhöhle des Patienten mit Kohlendioxid gefüllt (Insufflation) - diese 
Ansammlung von Gasen in der Bauchhöhle wird auch als Pneumoperitoneum 
bezeichnet. 


* Jat. invadere = eindringen 
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Abbildung 5.4: Skizzenhafte Darstellung eines Oberkörpers mit Leber (hellgrau), Magen (dun- 
kelgrau), Calot’sches Dreieck (gelb) und der Galle mitsamt Gallenwegen (grün) 
sowie arterieller Verbindung (rot). Im Rahmen einer laparoskopischen Chole- 
zystektomie werden üblicherweise vier künstliche Körperöffnungen geschaffen 
um die Gallenblase zu entfernen. Die Abbildung zeigt beispielhaft die Lage dieser 
vier Zugänge (0-3). Die Farben dienen zur Verdeutlichung der Zusammenhänge 
und sind nicht physiologisch motiviert. In Anlehnung an [Psc13, Tre91, Pad10]. 


Nach initialer Schaffung des Pneumoperitoneums werden vier künstliche 
Körperöffnungen geschaffen (vgl. Abbildung 5.4). Dazu wird jeweils ein 
spitzer Dorn (= Trokar) mit umgebender Hülse verwendet [Psc13, Feu91]. Die 
vier Trokare werden so positioniert, dass das notwendige Instrumentarium 
sinnvoll eingeführt werden. 


Während des Eingriffs wird zunächst der Gallengang bzw. das Calot’sches 
Dreieck freipräpariert. Danach wird dieser mit Clips verschlossen (sogenann- 
tes Clippen) und schließlich schneidend durchtrennt. Ebenso wird mit dem 
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Abbildung 5.5: Die Abbildung zeigt skizzenhaft die bei der Cholezystektomie notwendige 
Durchtrennung (0) des Gallenweges (grün) und der arteriellen Blutversorgung 
(rot). Weiterhin ist das sogenannte Calot’sches Dreieck (gelb) dargestellt, wel- 
ches als Orientierungshilfe im Bereich Leber, Gallenwege und Arterien dient. 
Im späteren Verlauf des Eingriffs wird die Gallenblase vom Leberbett entfernt 
(1). In Anlehnung an [Feu91]. 


Gefäß verfahren, welches die Gallenblase mit Blut versorgt (vgl. Abbildung 
5.5). Optional wird während des Eingriffs ein bildgebendes Verfahren einge- 
setzt, ein sogenannte intraoperative Cholangiographie. Danach wird die Gal- 
lenblase vom Leberbett entfernt. 


Letzteres wird dann zur Blutstillung mittels Elektrokoagulation, also einer 
Zerstörung von Gewebe mittels Strom, versorgt. Abbildung 5.6 zeigt einen 
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Abbildung 5.6: Die Abbildung zeigt eine Momentaufnahme eines prototypischen Operations- 
saales bei einer laparoskopischen Cholezystektomie. Der Patient P liegt rück- 
links auf dem Operationstisch. Operateur O, erster Assistent 1A, zweiter Assis- 
tent 2A und der Instrumentierende I stehen um den Tisch herum. Der Instru- 
mentierende I reicht die Instrumente von Instrumentiertisch IT weiter. Weitere 
Personen, wie beispielsweise der Anästhesist oder der Springer sind zur Verein- 
fachung nicht Teil der Abbildung. In Anlehnung an [Feu91]. 


prototypischen Operationssaal, in welchem die Operation stattfindet‘. Der 
Patient P befindet sich rücklings auf dem Operationstisch. Operateur O und 
zweiter Assistent 2A befinden sich auf der rechten Flanke des Patienten, wäh- 
rend der erste Assistent auf der gegenüberliegenden Seite positioniert ist. Der 
Instrumentierende I steht am Fußende und reicht bei Bedarf das notwendige 
Instrumentarium an oder nimmt dieses wieder entgegen? [Feu91, Pad10]. 


* Hinweis: Der Operationssaal selbst ist in den sogenannten OP eingebettet, der üblicherweise 
über Eingangs- und Ausgangsschleusen für Personal und Patienten betreten werden kann. Der 
OP kann darüber hinaus weitere Operationssäle, sowie Aufenthalts- und Lagerräume umfassen. 

2 Hinweis: In der Literatur wird auch von Instrumentierschwester, OP-Schwester. Schwester oder 
Instrumentierende gesprochen. 
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5.2 Konstituenten des Problems 


In den folgenden Kapiteln werden zunächst die Begrifflichkeiten zur Beschrei- 
bung der Problemstellung eingeführt (Kapitel 5.2.1) - daran anschließend 
werden mögliche Bewertungen der Problemlösung besprochen (Kapitel 5.2.2). 


5.2.1 Begrifflichkeiten 


Abbildung 5.7 zeigt ein Arbeitsablaufmodell der endoprothetischen Versor- 
gung eines Patienten mit einer Hüft-TEP anhand eines verkürzt dargestell- 
ten UML-Aktivitätsdiagramms, vgl. Kapitel 3.3 und 5.1.1. Dieser Formalis- 
mus wurde bereits in früheren Forschungsarbeiten zur Modellierung medi- 
zinischer Arbeitsabläufe [Phi15b, Phil5c, Phi16a, Phi16b, Phi17d] verwendet. 


Der Start der Aktivität Hüft-TEP wird durch einen ausgefüllten Kreis (Start- 
knoten) dargestellt, während der Doppelkreis (Endknoten) das Ende der Ak- 
tivität repräsentiert. Durchgeführte Aktionen werden in dieser Darstellung 
als abgerundete Rechtecke symbolisiert, gerichtete Kanten (Pfeile) stellen den 
Kontrollfluss dar. Im Beispiel werden die Aktionen sequentiell - d.h. also 
nacheinander ausgeführt, vgl. Kapitel 3.3.2. 


Ziel ist es nun, den vormodellierten medizinischen Arbeitsablauf mit den ak- 
tuellen Gegebenheiten im Operationssaal abzugleichen - und somit den Ist- 
Fortschritt der Operation zu bestimmen. Von Interesse ist es also beispielswei- 
se, ob gerade der Zugangsweg freipräpariert oder aber etwa der Hautschnitt 


durchgeführt wird (vgl. Abbildung 5.7). 


Auf der anderen Seite existieren über eine Sensierung der Gegebenheiten im 
Operationssaal und nachfolgender Merkmalsbildung entsprechende Merk- 
malswerte über der Zeit. Für den gegeben Anwendungsfall können Merkmale 
beispielsweise die Anzahl der Personen am Operationstisch oder die Anzahl 
verwendeter Instrumente sein. 


Merkmale bzw. deren Instanziierungen in Form von konkreten Merkmalswer- 
ten können durch einen Merkmalsvektor x gebündelt werden. Dieser wird im 
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Hüft-TEP 
Hautschnitt Zugangsweg Wunde Verband 
durchführen freipräparieren verschließen anlegen 
+ 


Abbildung 5.7: Die Abbildung zeigt ein vereinfachtes Modell des medizinischen Arbeitsablaufs 
einer endoprothetischen Versorgung eines Patienten mit einer Hüft-TEP. Ziel 
ist es, den vormodellierten Ablauf mit den aktuellen Gegebenheiten im Opera- 
tionssaal abzugleichen um dadurch den Ist-Fortschritt der Operation schätzen 
zu können. Als visuelle Hilfsmitteln sind der Abbildung des Modells ein rotes 
Rechteck, ein roter Pfeil sowie drei Punkte (---) hinzugefügt - diese sind nicht 
Teil der UML-Spezifikation [OMG17]. Die drei Punkte symbolisieren eine Ab- 
folge beliebiger Aktionen, die der Einfachheit halber nicht dargestellt sind. Das 
rote Rechteck und der Pfeil symbolisieren den geschätzten Ist-Fortschritt, der 
während der Operation sukzessive, in Abhängigkeit der stattfindenden Beob- 
achtungen, angepasst wird. 


Folgenden als Spaltenvektor definiert, dessen Elemente gerade die einzelnen 
Merkmalswerte sind. Also: 


= (Koen de) s (5.1) 


Dabei reprasentiert der Skalar d die Anzahl der gebiindelten Merkmale und 
damit die Dimension des resultierenden Merkmalsraumes welches dem tech- 
nischen System zur Lösung des Problems zur Verfügung steht. Um Platz zu 
sparen werden Merkmalsvektoren x in dieser Ausarbeitung transponiert, al- 
so horizontal, dargestellt und in Folge mit dem Symbol eines hochgestellten 
T versehen’. 


In jedem Zeitschritt wird ein neuer Merkmalsvektor x mit Index t seitens 
des technischen Systems im Operationssaal beobachtet. Dieser wird in dieser 
Ausarbeitung festgelegt als: 


we: (5.2) 


* Hinweis: Eine Auflistung aller Symbole findet sich im Symbolverzeichnis ab Seite 209. 


114 


5.2 Konstituenten des Problems 


Infolgedessen ergibt sich über die Zeit eine Beobachtungssequenz von Merk- 
malsvektoren 


es alee aa (5.3) 


Die Beobachtungssequenz x°! steht dem technischen System als Beobachter 
der Gegebenheiten im Operationssaal zur Verfiigung wohingegen der aktu- 
elle Ist-Fortschritt (vgl. Abbildung 5.7, rote Markierung) nicht direkt beob- 
achtbar ist und somit verborgen bleibt. Das bedeutet, es besteht eine Liicke 
zwischen der Beobachtungssequenz x°: auf der einen und dem zu ermitteln- 
den Ist-Fortschritt innerhalb des Modells auf der anderen Seite (0.B.d.A. vgl. 
Abbildung 5.8). Diese Lücke soll im Anwendungsfall zur Laufzeit (engl. on- 
line), unter Kenntnis der bisher beobachteten Merkmalsvektoren aber ohne 
Kenntnis der noch zukünftig kommenden - also sprich ohne Kenntnis der 
gesamten Beobachtungssequenz (engl. offline) - geschlossen werden. 


In traditionellen Ansätzen wie den Hidden Markov Modellen (HMM) wer- 
den hierzu Wahrscheinlichkeitsverteilungen verwendet, um anzugeben, wie 
wahrscheinlich es ist, dass ein bestimmter Merkmalsvektor x in einer be- 
stimmten Phase beobachtet wird. In anderen Worten: Man nutzt die bedingte 
Wahrscheinlichkeit für das Vorliegen eines bestimmten Merkmalsvektors x 
gegeben die Phase (vgl. Abbildung 5.8, untere Zeile). 


Unter Verwendung weiterer Parameter des HMM kann umgekehrt die Wahr- 
scheinlichkeit geschätzt werden, dass gegebenen eine Beobachtungssequenz 
eine bestimmte Phase vorliegt. Dadurch wird die Lücke zwischen der Beob- 
achtungssequenz und des Ist-Fortschritts im Modell überbrückt (vgl. Abbil- 
dung 5.8, oberer Bereich). 


Bezogen auf das zugrunde liegende Klassifikationsproblem, stellen die ein- 
zelnen Phasen die Klassen œ € Q dar. Durch Lernstichproben mit Merk- 
malsvektoren bekannter Klassenzugehörigkeiten w(x), können die Klassifi- 
kationsmodelle überwacht eingelernt werden. Zur nachfolgenden Klassifika- 
tion von Merkmalsvektoren mit unbekannter Klassenzugehörigkeit kommen 
dann die modellspezifischen Ansätze zur Schätzung der Klassenzugehörigkeit 
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Hüft-TEP 


| Hautschnitt ; || Zugangsweg 
:] durchführen |: freipräparieren 


PIE) 


Abbildung 5.8: Die Abbildung zeigt die Lücke zwischen einer Sequenz von Merkmalsvekto- 
ren und dem Ist-Fortschritt des Modells des Arbeitsaublaufes. Letzterer ist dem 
technischen System (0.B.d.A.) verborgen. Um die Lücke dazwischen zu über- 
brücken, kann mit Hilfe einer Wahrscheinlichkeitsverteilung angegeben wer- 
den, wie wahrscheinlich es ist, dass ein bestimmter Merkmalsvektor in einer 
bestimmten Phase beobachtet wird - sprich: P(x|E). 


P(w|x) zum Tragen - diese und weitere Einzelheiten der Modellcharakteristi- 


ka werden in den folgenden Abschnitten, unter Berücksichtigung des Standes 


der Technik, näher besprochen. 


Die beschriebenen Begrifflichkeiten sollen nun noch in Bezug zum Begriff des 


Expertensystems, vgl. Kapitel 2.2, gesetzt werden. Über die Problemstellung 


liegt einerseits bereichsspezifisches Wissen vor, beispielsweise über typische 


Operationsabläufe oder typischerweise verwendete Werkzeuge in den einzel- 


nen OP-Phasen. Das bereichsspezifische Wissen bildet gemeinsam mit dem 


fallspezifischen Wissen die Wissensbasis des Expertensystems. Während das 
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bereichsspezifische Wissen gemeinsam mit Experten formalisiert und daten- 
getrieben erweitert wird, wird das fallspezifische Wissen in der hier vorlie- 
genden Problemstellung ohne Beteiligung des Experten, allein durch Sensie- 
rung erhoben. Es liegt damit nach [Pup13a] ein eingebettetes Expertensystem 
vor, vgl. Kapitel 2.2, in welchem das fallbasierte Wissen durch die Beobach- 
tungssequenz x°'! gegeben ist. Das fallbasierte Wissen liegt somit online vor, 
wird nach und nach aufgebaut und nach der Bearbeitung eines spezifischen 
Anwendungsfalls wieder gelöscht. 


5.2.2 Bewertung der Problemlösungen 


In der Literatur finden sich verschiedene Maße zur Bewertung der Lösung des 
in Kapitel 5.2.1 beschriebenen Problems. Hierbei muss letztlich die Klassenzu- 
gehörigkeit von Merkmalsvektoren geschätzt werden, um die Lücke zwischen 
subsymbolischen Merkmalsausprägungen und den auf symbolischer Ebene 
gelegenen medizinischen Phasen, also den Klassen, zu schließen. Wie häufig 
nun eine Phase korrekt geschätzt wurde, also wie häufig bei der Problemlö- 
sung der Idealfall ö(x) = w(x) vorlag, kann anschaulich mit einer sogenann- 
ten Konfusionsmatrix visualisiert werden. 


Mittels einer solchen Matrix werden die wahren Klassenzugehörigkeiten w(x) 
den durch die Klassifikation geschätzten Klassenzugehörigkeiten @(x) gegen- 
über gestellt. Für den Fall zweier Klassen ergibt sich eine Matrix C mit den in 
Abbildung 5.9 dargestellten, charakteristischen Einträgen c; ; mit i, j € [0,1]. 


Abgeleitet von der üblichen Einteilung der beiden involvierten Klassen in eine 
sogenannte Positiv- sowie Negativklasse repräsentieren die true positives (tp) 
und true negatives (tn) die Anzahl der Fälle, in denen bei der Problemlösung 
die geschätzte Klassenzugehörigkeit jeweils mit der wahren Klassenzugehö- 
rigkeit der Merkmalsvektoren übereinstimmte. Sprich: die Diagonalelemente 
Co,o und cı ı der Matrix C bündeln die Anzahl der Fälle, in denen Merkmals- 
vektoren gemäß ihrer Klassenzugehörigkeit korrekt klassifiziert wurden, sich 
also die geschätzte Klassenzugehörigkeit als tatsächlich zutreffend, also als 
wahr (engl. true), herausgestellt hat. 
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a pos. tp fn 


neg. | fp tn 


Abbildung 5.9: Konfusionsmatrix fiir den Zweiklassenfall. Die true positives (tp) und true ne- 
gatives (tn) repräsentieren die Anzahl der Fälle, in denen bei der Problemlösung 
die geschätzte Klassenzugehörigkeit jeweils mit der wahren Klassenzugehörig- 
keit der Merkmalsvektoren übereinstimmte. Zum Anderen können Merkmals- 
vektoren irrtümlich als positiv oder aber negativ klassifiziert werden - in diesen 
Fällen war die Schätzung falsch positiv oder aber falsch negativ. Die Anzahl die- 
ser Fälle finden sich als fp (falsch positiv) oder aber als fn (falsch negativ) in den 
Matrixeinträgen abseits der Diagonale wieder. 


Von diesen Idealfällen kann es allerdings Abweichungen geben - nämlich 
dann, wenn die Schätzung der Klassenzugehörigkeit von Merkmalsvektoren 
eben nicht mit deren wahren Klassenzugehörigkeit übereinstimmt. Im Zwei- 
klassenfall gibt es für diese Konfusion, welche sich abseits der Diagonalele- 
mente abspielt, zwei Möglichkeiten (vgl. Abbildung 5.9). 


Zum Einen kann eine in Wahrheit vorliegende Zugehörigkeit zur Positivklas- 
se als eine Zugehörigkeit zur Negativklasse geschätzt worden sein, sprich: 
Merkmalsvektoren die eigentlich zur Positivklasse zugehörig sind, wurden 
fälschlicherweise negativ klassifiziert - diese Schätzungen sind somit falsch 
negativ (engl. false negative). 


Zum Anderen können Merkmalsvektoren in entsprechender Weise irrtümlich 
als positiv klassifiziert worden sein - in diesen Fällen war die Schätzung falsch 
positiv (engl. false positive). Die Anzahl der beschriebenen Fälle wird über die 
Matrixeintrage Co, für die false negatives (fn) und cı,o für die false positives 
(fp) zusammengefasst. 
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Aus dieser Einteilung der Klassifikationsergebnisse lassen sich verschiedene 
Kennzahlen gewinnen, die zur Quantifizierung der Qualität der Problemlö- 
sung aus verschiedenen Perspektiven herangezogen werden können. Eine sol- 
che Kennzahl ist die Genauigkeit (engl. Accuracy’): 


tp + in 


tp+in+ fp+ fn SA]: 2 


Genauigkeit = 


Hier werden die tatsächlichen Treffer der Diagonalen, bei denen also w(x) = 
(x) gilt, ins Verhältnis zur Summe aller Schätzungen gesetzt? (vgl. Matrix C 
in Abbildung 5.9). 


Die sogenannte Precision (auch: Positive Predictive Value, PPV oder Relevanz) 
stellt die Anzahl der als korrekt zur Positivklasse gehörig klassifizierten Merk- 
malsvektoren ins Verhältnis zur Anzahl derjenigen Fälle, in denen der Klassi- 
fikator ein Vorliegen der Positivklasse geschätzt hat: 


tp 
+ fp 


Irrt der Klassifikator bezüglich des Vorliegens der Positivklasse nie, es gilt also 
fp = 9, ergibt sich die bestmégliche Precision mit dem Wert 1. Dieser Wert ist 


Precision = ; € [0,1]. (5.5) 


aber letztlich nur eine Seite der Medaille. 


Mit dem sogenannten Recall (auch: True Positive Rate, TPR oder Sensitivitat) 
können umgekehrt die Anzahl der als korrekt zur Positivklasse gehörig klas- 
sifizierten Merkmalsvektoren ins Verhältnis zu den tatsächlich vorhandenen 


* Hinweis: Auch finden sich in der Literatur die ins Deutsche übersetzen Begriffe Akkuratheit, 
Akkuranz und Akkuratesse. 

2 Hinweis: Der Begriff der Genauigkeit findet sich in verschiedenen Domänen mit andersarti- 
ger Bedeutungen. In dieser Ausarbeitung wird der Begriff stets im Kontext der Klassifikation 
verwendet und ist entsprechend der oben genannten Definition in Gleichung (5.4) zu verstehen. 
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Positivfällen in der Stichprobe gesetzt werden: 


tp 
+ fn 


Entsprechend ergibt sich der Bestwert 1 des Recalls in dem Falle, in dem kei- 


Recall = iD € [0,1]. (5.6) 


nerlei Merkmalsvektoren der Positivklasse übersehen wurden. In einem sol- 
chen Fall gilt fn = 0. 


Zur Verschmelzung beider Aspekte wird üblicherweise das harmonische Mit- 
tel' aus Recall (5.6) und Precision (5.5) gebildet: 


2 2 - Precision - Recall 
[oS er (5.7) 
Recall ~ + Precision Precision + Recall 
2-t t 
P ee a € [0,1]. (5.8) 


rt ip4l.(fp+ fin) 


Dabei werden fp und fn in gleicher Weise berücksichtigt (5.8). Neben dem 
sogenannten F,-Score - häufig auch kurz F-Score genannt - gibt es den all- 


gemeineren Fg-Score der verschiedene Gewichtungen beider Aspekte ermög- 


licht: 


(1 + 8?) - Precision - Recall 


Ben B2 - Precision + Recall on 
= (1+ 6?) tp 
HP + p+ Pfr 2 
= Ze Pen e [0,1]. (5.11) 
R 2. 
P+ m tR- m 


n 


1 i ie — 
Hinweis: X = 
harm xy i+..+xq! 
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Ow 


neg. pos. pos. pos. 


Abbildung 5.10: Im hinteren, oberen Bereich ist einerseits mit Og eine beispielhafte konkrete 
Ausprägung der geschätzten Klassenzugehörigkeiten (x) über die Zeit darge- 
stellt. Im vorderen, unteren Bereich ist mit O andererseits eine beispielhafte 
konkrete Ausprägung der tatsächlichen, wahren Klassenzugehörigkeiten w(x) 
über die Zeit skizziert. Dort, wo gedanklich Og und Oy auf der gemeinsamen 
zeitlichen Sequenz zum Schnitt kommen, liegen die tp vor. Sprich die geschätz- 
te Klassenzugehörigkeit stimmt mit der wahren Klassenzugehörigkeit überein. 
Andere Bereiche, die also nicht im Schnitt liegen, sind entweder als fp oder fn 
einzustufen und auf der Abbildung entsprechend markiert. 


Für die gegebene Problemstellung (vgl. Kapitel 5.2.1) wird allerdings statt des 
F-Scores üblicherweise der Jaccard-Score' herangezogen. Dieser ist in diesem 
Zusammenhang definiert als: 


tp 
tp + fn + fp e [01] 


Jaccard-Score = (5.12) 


Der Kennwert lässt sich zurückführen auf den sogenannten Jaccard- 
Koeffizienten [Jac12] (auch: Jaccard-Index), bei dem der Quotient aus dem 
Betrag des Schnitts (engl. Intersection) und dem Betrag der Vereinigung (engl. 
Union) zweier Mengen gebildet wird. Deswegen ist der Jaccard-Koeffizient 
auch unter dem Begriff Intersection over Union (IoU) bekannt’. 


Im vorliegenden Falle werden die geschätzte Klassenzugehörigkeit @(x) und 
die tatsächliche Klassenzugehörigkeit w(x) der Sequenz von Merkmalsvekto- 
ren verglichen. Dort wo beide übereinstimmen , also im Schnitt, liegen dann 


* Hinweis Häufig wird der Jaccard-Score verkürzt als Jaccard bezeichnet. 

? Hinweis: Der IoU spielt in der Objekterkennung eine wichtige Rolle - dort wird der zu erken- 
nende Bildbereich mit dem tatsächlich erkannten Bildbereich über die Schnitt- bzw. Vereini- 
gungsmenge in Beziehung gesetzt. 
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die tp vor. Abseits davon wurden entweder Merkmalsvektoren der Positiv- 
klasse übersehen (fn) oder dieser irrtümlich zugewiesen (fp). 


Seien beispielsweise die geschätzten und die tatsächlichen Klassenzugehörig- 
keiten vierer Merkmalsvektoren Xp, ...,X3 beschrieben durch: 


O = (@(x°), w(x"), w(x"), @X°)), 


Og = (A(x), B(x"), ax), B(x?) ). 


Dann ergibt sich fiir eine konkrete Auspragung 
Ow = (pos., pos., pos., neg.) , 


Og = (neg., pos., pos., pos.) , 


der in Abbildung 5.10 dargestellte Sachverhalt. Uberlappungen beziiglich 
der geschätzten und der tatsächlichen Klassenzugehörigkeit ergeben sich als 
Schnittmenge, wenn O, und Og gedanklich als Mengen auf die Sequenz von 
Merkmalsvektoren projiziert werden. 


In ähnlicher Weise lassen sich Precision und Recall interpretieren; Während 
im Zähler der Betrag der Schnittmenge erhalten bleibt, finden sich in den Nen- 
nern der Kennwerte entweder der Betrag der Menge der Schätzungen (Pre- 
cision) oder der Betrag der Menge der tatsächlichen Klassenzugehörigkeiten 
(Recall). 


Wie bereits eingangs erwähnt, lassen sich die Klassifikationsergebnisse über- 
sichtlich in einer Konfusionsmatrix darstellen (vgl. Abbildung 5.9). Ein Zah- 
lenbeispiel soll dies im Folgenden verdeutlichen. 
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alx) @(x) 
pos. neg. pos. neg. 
wa) pos. 5 4 w) pos. tp fn Recall 
neg. 0 1 neg. |. fp tn 
Precision 


Abbildung 5.11: Links: Konfusionsmatrix fiir den Zweiklassenfall mit konkreten Auspragungen 
der Einträge aus Abbildung 5.9. Rechts: Konfusionsmatrix mit skizzenhafter 
Markierung der betroffenen Einträge bei Berechnung von Precision und Recall. 


Für die genannten Kennzahlen ergeben sich am Beispiel der in Abbildung 5.11 
dargestellten Konfusionsmatrix: 


Precision = en ae =1 
— tp+fp 5+0 ”’ 
_ p _ 5 5 
cl ae 9” 
t 
F; -Score = I P = I 5 ei, 
ipto tD S+>-+4) 7 
tp 5 5 
d= = = i 
MET pe SE0F4 9 
t t 
Genauigkeit = Paw at] 2 


iptintfptfn 5+1+0+4 10° 


Dabei zeigt die Precision mit dem Maximalwert 1 an, dass der Klassifikator 
bezüglich des Vorliegens der Positivklasse nie irrt und somit die Anzahl der 


fp bei 0 liegt. 


Bei Recall indes, wurden 4 Merkmalsvektoren der Positivklasse „übersehen“ 
und somit irrtümlich der Negativklasse zugeordnet. Da gleichzeitig 5 Merk- 
malsvektoren korrekt zugeordnet wurden, ergibt sich in 5 von insgesamt 9 
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Fällen eine korrekte Zuordnung der Merkmalsvektoren der Positivklasse. Der 
resultierende Recall ergibt sich zu =. 


Der F,-Score bezieht beide Arten der Fehlklassifikation in gleicher Weise ein, 
indem fp und fn arithmetisch gemittelt werden. Hierdurch ergibt sich im Bei- 
spiel ein Zähler von 7 und der F} -Score ist insgesamt gegeben durch >. Beim 
Jaccard-Score fließen die Fehlklassifikationen ungemittelt ein - es ergibt sich 
ein Jaccard-Score von =. Da im Beispiel fp = 0 gilt, entspricht der Jaccard- 
Score dem Recall. 


Betrachtet man alle 10 Klassifikationsversuche in Abbildung 5.11, so lag dort 
in 6 von 10 Fällen eine korrekte Zuordnung zur jeweiligen Klasse vor (vgl. 
Diagonalwerte). Die Genauigkeit ergibt sich somit zu T 


Für den Mehrklassenfall verschmieren sich die fn, fp und tn auf die Einträge 
der jeweils übrigen Klassen. Die Konfusionsmatrix bläht sich in Zeilen- und 
Spaltenzahl entsprechend der Klassenanzahl auf. Abbildung 5.12 verdeutlicht 
dies links für den Fall der geschätzten Klassenzugehörigkeit zur wahren Klas- 
se Wy und rechts beispielhaft für den Fall der geschätzten Klassenzugehörig- 
keit zur wahren Klasse w3. 


Werden die Einträge der markierten Flächen für fn, fp und tn pro geschätz- 
ter Klassenzugehörigkeit zur wahren Klasse ,, aufaggregiert ergeben sich n 
Konfusionsmatrizen gemäß Abbildung 5.9. Hieraus können die klassenweisen 
Kennwerte gemäß Formeln (5.6), (5.5), (5.7) und (5.4) berechnet werden. 


Um die Problemlösung anhand der dargestellten Kennzahlen fundiert bewer- 
ten zu können, muss die Stichprobe {xọ, ...,X,} mit bekannten Klassenzuge- 
hörigkeiten w(x;) für j = 0, ...,n mit Bedacht genutzt werden. 


Wird die komplette Stichprobe zum Einlernen des Klassifikators mit nachge- 
schalteter Bewertung verwendet,kann dessen Fähigkeit zur Generalisierung 
nicht bewertet werden. Üblicherweise wird deswegen eine Partitionierung der 
Gesamtstichprobe in eine Lern- und Teststichprobe vorgenommen." 


* Hinweis: Oft wird hierbei auch von Lern- und Testmenge gesprochen. 
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@(x) 
â â on 
Wo tp euer “fan A 
w| o 
wx) w, | i 
Jp tn R 
i @(x) 
ð Â, ð, on 
Wy A Wo 
e 
tn fp tn 
w] 3 
w(x) w, e--fn--e tp ecn - 
? 
tn fp tn 
w, 1 


Abbildung 5.12: Konfusionsmatrizen im Falle von n Klassen mit n > 2 (Mehrklassenfall). Links: 
tp, fn, fp und tn bezüglich der geschätzten Klassenzugehörigkeit Wo. Rechts: 
Darstellung beispielhaft für die geschätzte Klassenzugehörigkeit #2, welche 
sich entsprechend für die anderen skizzierten Klassen entlang der Diagonale 


ergibt. 
Sprich: 
Doesamt = Prem U Dres » (5.13) 
so dass gilt: 
Diem N Dres = Ø. (5.14) 
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Dabei dient Diem zum Einlernen des Klassifikators, wohingegen Drest erst 
nach dem Lernvorgang zur finalen Bewertung der Problemlösung herangezo- 
gen wird. 


Bei geringen Stichprobengrößen und der damit einhergehenden Problematik 
der großen Varianz geschätzter Fehlerwahrscheinlichkeiten bzw. nachgela- 
gert der oben genannten Kennwerte, bieten sich Verfahren an, die die vor- 
handenen Stichproben clever ausnutzen. 


Eine übliche Vorgehensweise ist die m-fache Kreuzvalidierung, bei der die 
Einteilung in Lern- und Teststichprobe rollierend über der Gesamtstichprobe 
erfolgt. Die Gesamtstichprobe wird zunächst in m annähernd gleich große 
Partitionen geteilt, d. h.: 


Deesamt = {Pi : i =0,..,m—1},m >22, (5.15) 
so dass gilt: 


DND =Ø VYi#j, (5.16) 
ID= D] Vi#j. (5.17) 


In jedem Durchlauf der Kreuzvalidierung fungiert eine andere Teilmenge D; 
gemäß Gleichungen (5.15) bis (5.17) als Teststichprobe. Die restlichen Teil- 
mengen dienen als Lernstichprobe. In Folge tritt ein Klassifikator in m Durch- 
läufen zum Leistungstest an, wodurch m Kennwerte zur Leistungsmessung 
zur Verfügung stehen. Üblicherweise werden durch Bildung des arithmeti- 
schen Mittels die abschließenden Leistungswerte der Kreuzvalidierung be- 
rechnet. Weiterhin lassen sich Varianz und Standardabweichung der Kenn- 
werte bestimmen, was für einen Leistungsvergleich unterschiedlicher Klassi- 
fikatoren von Nutzen ist. 


Abbildung 5.13 zeigt die beschriebenen Sachverhalte für eine 4-fache Kreuz- 
validierung. In den Zeilen sind die Durchläufe 0-3 dargestellt. In Hellgrau ist 
jeweils jene Teilmenge hervorgehoben, die für einen gegebenen Durchlauf 
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Durchlauf Wahl der Teilmengen als Lern- und Teststichprobe 
0 Do Dı D, D3 
1 Do Dı D2 D3 
2 Do Dı Dz D3 
3 Do Dı D2 D3 


Abbildung 5.13: Die Abbildung zeigt eine 4-fache Kreuzvalidierung. In den Zeilen sind die 4 
Durchläufe sowie die jeweilige Wahl der Teilmengen als Lernstichprobe (weiß) 
oder aber als Teststichprobe (hellgrau) dargestellt. In jedem Durchlauf 0-3 wird 
eine andere Teilmenge D; mit i = 0...3 als Teststichprobe verwendet. Im letz- 
ten Durchlauf gilt beispielsweise: Drest : = D3, sowie Diem : = Do UD |UD}. 


als Testmenge herangezogen wird. Die Vereinigung der restlichen Teilmen- 
gen des Durchlaufs wird als Lernstichprobe verwendet. D.h. für Durchlauf 0 


gilt: Drest = Do; sowie Diem = Dı U D, U D3. 


Für die abschließenden Leistungswerte, wie beispielsweise den F,-Score, er- 


hält man: 
ie 
F; -Score -Score = 4 Li “Score; , (5.18) 
3 
SF, -Score = Ya -Score, — F; -Score )? . (5.19) 
i=0 


Wobei F; -Score; den im i-ten Durchlauf erzielten F; -Score des Klassifikators 
beschreibt. Wird die Anzahl der Durchläufe maximal, also mit m = |Dgesamtl 
(vgl. Gleichung (5.15)) gewählt, so spricht man von einer „leave-one-out“ 
Kreuzvalidierung. Wörtlich werden hier also zum Lernen in jedem Durchlauf 
alle Elemente der Gesamtstichprobe bis auf ein Element genutzt. 
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Es stellt sich abschließend noch die Frage, welche Modellkonfiguration für die 
Leistungsmessung mittels Kreuzvalidierung ausgewählt werden soll. Um die 
möglichen Modellkonfigurationen nicht auf die Teststichproben hin zu opti- 
mieren, sollte neben Lern- und Teststichprobe eine weitere Stichprobe eta- 
bliert werden. Im Rahmen der eben vorgestellten Kreuzvalidierung bietet es 
sich an, die dargestellte Vorgehensweise verschachtelt anzuwenden [Dei20]. 


Dazu wird in einer äußeren Schleife die bereits bekannte rollierende Eintei- 
lung in Test- und Lernstichproben vorgenommen. Darüber hinaus wird zu- 
sätzlich innerhalb der angedachten Lernstichproben eine weitere rollierende 
Einteilung in Lern- und sogenannte Validierungsstichproben umgesetzt. In 
der letztgenannten, inneren Schleife werden verschiedene Modellkonfigura- 
tionen bewertet. Die abschließende Leistungsmessung erfolgt mit der noch 
unbekannten Teststichprobe der äußeren Schleife. 


Abbildung 5.14 zeigt das Vorgehen für eine 4-fache Kreuzvalidierung, in wel- 
che eine 3-fache Kreuzvalidierung eingebettet ist. Im äußeren Durchlauf 0 gilt 
für die Teststichprobe (hellgrau): Dress := Do. Die Vereinigung der restli- 
chen Mengen wird einer weiteren rollierenden Einteilung in Lernstichproben 
(weiß) sowie Validierungsstichproben (dunkelgrau) zugeführt. Für Durchlauf 
0,0 gilt somit: Dya := Dı und Diem := Dz U D3. 


Bei den vorgestellten Kreuzvalidierungen werden die Leistungswerte der ein- 
zelnen Durchläufe typischerweise arithmetisch gemittelt. Siehe hierzu das 
Beispiel des Recalls in den Gleichungen (5.18) und (5.19). Dies ist insofern von 
Bedeutung, als dass beispielsweise der F,-Score zwar als das harmonische Mit- 
tel aus Precision und Recallbeschrieben wird (vgl. Gleichung (5.7)), gleichzeitig 
aber der über die Durchläufe arithmetisch gemittelte F} -Score nicht zwangs- 
läufig zwischen den über die Durchläufe arithmetisch gemittelten Kennwer- 
ten Precision und Recallliegen muss. 


Folgendes Beispiel verdeutlicht diesen Zusammenhang: Gegeben sei eine Ge- 
samtstichprobe Dgesamt Mit |Dogesamt| = 12. Diese Stichprobe werde für eine 
3-fache Kreuzvalidierung gemäß der Gleichungen (5.15) bis (5.17) genutzt. In 
jedem der Durchläufe mit Index i = 0,1,2 sei die jeweilige Teststichprobe 
zur Leistungsmessung eines Klassifikators dabei durch 4 Merkmalsvektoren 
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Durchlauf Teilmengen als Test-, Validierungs- und Lernstichproben 
0 Do 
0,0 Dı D2 D3 
0,1 Dı Dz D3 
0,2 Dı Dz D3 
1 Dı 
2 D2 
3 D3 
3,0 Do D, |» 
3,1 Do Dı | D2 
3,2 Do vr Wu 


Abbildung 5.14: 


Die Abbildung zeigt eine 4-fache Kreuzvalidierung, in die eine 3-fache Kreuz- 
validierung eingebettet wurde. In den Zeilen sind die 4 äußeren Durchläufe 
(0-3) sowie die insgesamt 12 inneren Durchläufe 0,0 - 3,2 vereinfacht abgebil- 
det. Die Teststichproben sind hellgrau, die Validierungsstichproben dunkelgrau 
und die Lernstichproben weiß dargestellt. In jedem Durchlauf 0-3 wird eine 
andere Teilmenge Dj mit i = 0...3 als Testmenge verwendet. Für die Verei- 
nigung der jeweiligen Restmengen werden im Beispiel die Validierungs- und 
Lernstichproben nach dem Schema einer 3-fach Kreuzvalidierung festgelegt. 
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x?, ...,X}? gegeben. Dabei seien die wahren und die geschätzten Klassen der 4 


Merkmalsvektoren des i-ten Durchlaufs allgemein beschrieben durch: 
Oig == (co(x?), co(x?}), co(x?), co(x?) ) ’ 


Oio = (xP), Ax}, ER), O@})). 


Zur Demonstration des Sachverhalts seien folgende beispielhafte wahre und 
geschätzte Klassen der 4 Merkmalsvektoren für die Durchlaufe 0-2 gegeben, 
wobei der Einfachheit halber von zwei möglichen Klassen, pos. und neg., aus- 
gegangen wird: 

Oo,» = (pos., neg., neg., neg.) , 

Ov, = (pos., pos., pos., pos.) , 

O14 = (pos., pos., pos., pos.) , 

O1, = (pos., pos., neg., neg.) , 


02, = (pos., pos., pos., neg.) , 


O2, = (pos., neg., neg., pos.) . 


Für jeden der Durchlaufe 0-2 wird nach Schema der Gleichungen (5.5), (5.6) 
und (5.7) sowie (5.18), (5.19) sowohl Recall und Precision als auch F; -Score be- 


stimmt. 


Betrachtet man z.B. zunächst O,,„ und Ogo, so lässt sich errechnen: 


tp = 1, fp = 3, tn = 0, fn = 0. 
Folglich ergeben sich für die Precision ein Wert von * und für den Recall ein 


4 
Wert von 1. Das harmonische Mittel beider Werte und damit der F} -Score ist 


gegeben durch: = 
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Tabelle 5.2: Die Tabelle zeigt in den ersten Zeilen die Ergebnisse der Kreuzvalidierung bezüglich 
Precision, Recall und F, -Score. In den unteren Zeilen ist das arithmetische Mittel der 
darüber liegenden Leistungswerte der einzelnen Durchläufe angegeben. 


Durchlauf Precision Recall F -Score 
0 2 1 2 
4 5 
1 1 s 2 
2 3 
2 = t 2 
2 3 5 
Arithmet. - Cs) ery Gop ean ae LEER 
. 4 4 4 3 `6 6 6 3 `B 15 B 
Mittel 
ie sat 22 
~ 12 18 45 
(~ 0,583) (x 0,611) (= 0,489) 


Vollzieht man diese Rechnungen fiir alle Durchlaufe, so ergeben sich die Leis- 
tungswerte aus Tabelle 5.2. Ersichtlich wird hier, dass der über die Durchlau- 
fe arithmetisch gemittelte F} -Score nicht zwischen den über die Durchläufe 
arithmetisch gemittelten Werten fiir Precision und Recall liegt, obgleich sich 
natürlich pro Durchlauf der F,-Score als harmonisches Mittel aus diesen bei- 
den Kennwerten darstellt. 
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5.3 Stand der Technik 


Im folgenden Abschnitt werden nennenswerte Modellierungsansätze für ei- 
ne medizinische Phasendetektion vorgestellt. Dabei werden die unterschied- 
lichen Eigenschaften der Modelle aufgezeigt. 


5.3.1 Random Forest (RF) 


Die Idee hinter einem Random Forest (RF) ist es, mehrere Entscheidungsbäu- 
me in einem Wald (engl. forest) heranzuziehen und deren Ergebnisse zu kom- 
binieren. Bezogen auf die Klassifikation ist ein RF ist also ein Modell, das sei- 
ne Entscheidungen aus einzelnen Klassifikatoren (hier: Entscheidungsbäume) 
bezieht, die in einem Ensemble gebündelt werden (hier: Wald) - RF zählen da- 
her zu den so genannten Ensemble-Methoden [Rok10, Zho12]. 


Ein RF nutzt dabei eine Menge von m Entscheidungsbäumen [Bre01] 


{b,&) : i = 0, ..., m}. (5.20) 


Zum Training dieser Entscheidungsbäume werden zunächst verschiedene 
Lernstichproben nach dem Zufallsprinzip generiert. Dazu wird für jeden 
Baum b;(x) aus einer gemeinsamen, gegebenen, originalen Lernstichprobe 
D = {Xo, ..- , Xn} mit bekannten Klassenzugehörigkeiten co(x;) für j =0,...,n 
eine eigene Lernstichprobe erzeugt. Dabei wird nach dem Prinzip Ziehen- 
und-Zurücklegen verfahren: Es werden n’ < n Merkmalsvektoren x; € D 
zufällig (und ggf. mehrfach) in die jeweilige baumspezifische Lernstichprobe 
übernommen. Diese Vorgehensweise wird in der Statistik auch als Boostra- 
ping bezeichnet‘. In Kombination mit einer Aggregierung (engl. aggregation) 


der Ergebnisse, wie im vorliegenden Falle durch die Ensemble Methode 


n 


Hinweis: Der Stiefelriemen (engl. boostrap) wird teils als Anspielung auf eine Münchhausen- 
geschichte gesehen, in der sich der Protagonist, feststeckend in einem Sumpf, an den eigenen 
Stiefeln/Haaren aus der Lage befreit. Selten wird daher in diesem Zusammenhang der deutsche 
Begriff der Münchhausenmethode verwendet. 
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der RF gegeben, kann von sogenanntem Bagging gesprochen werden, das 
bedeutet ein Boostraping mit nachfolgender Aggregation. Die Idee dahinter 
ist, übertragen auf RF, eine große Anzahl möglichst unkorrelierter Bäumen 
zu erzeugen (jeder Baum sieht einen anderen Teil der Lernstichprobe) und die 
Varianz durch Mittelwertbildung (Wald ist ein Ensemble aus gleichgewichte- 
ten Bäumen) zu senken. Eine eingängige Herleitung dieses Zusammenhangs 
für RF findet sich in [Fri01]. 


Um die Baume des Waldes weiter zu dekorrelieren, wird bei den RF allerdings 
der Ansatz des Baggings nocheinmal erweitert - auch hier spielt die zufällige 
(engl. random) Auswahl, diesmal nicht der Merkmale sondern der Merkmals- 
werte, eine Rolle. Das bedeutet, beim Training eines Entscheidungsbaumes 
wird für jeden Knoten nur eine zufällige Teilmenge der Merkmalswerte eines 
Merkmalsvektors für die Aufteilung in Äste des Baums berücksichtigt. Die 
Größe des betrachteten Merkmalsvektors x ist also in jeder Teilung d’ < d 
(häufig wird d’ = Vd verwendet). Basierend auf einem Gütekriterium (bei- 
spielsweise Entropie- oder Geni-Heterogenitätsmaß) und unter Berücksichti- 
gung der d’ Merkmalswerte, wird die Verzweigung mit höchster Güte berech- 
net". 


Diese Verzweigungen teilen die Lernstichprobe sukzessive in disjunkte Teil- 
mengen auf, die nach dem Gütekriterium bezüglich ihrer Klassenzugehörig- 
keit wenig heterogen sind. Ein mögliches Abbruchkriterium des Trainingsal- 
gorithmus eines Baumes ist, neben dem Trivialfall der Erzeugung einer voll- 
ständig homogenen Teilmenge, dass eine Mindestanzahl an Stichprobenele- 
mente in einem Knoten unterschritten wird - solche Knoten werden dann zu 


1 Hinweis: Würde für jede Teilung d’ = d gelten, so läge gesamt betrachtet ein Bagging vor, 
also ein Boostraping und nachfolgende Aggregierung der Ergebnisse der Einzelklassifikatoren 
- sprich: Bagging von Bäumen. Die Idee des Baggings von Klassifikatoren wurde bereits 1996 
in [Bre96] vorgestellt - insofern können RF, welche 5 Jahre später vom selben Autor in [Bre01] 
präsentiert wurden, als Erweiterung des Ansatzes speziell für Entscheidungsbäume gesehen 
werden. Diese Erweiterung betrifft die Einschränkung der Nutzung von Merkmalen - dies er- 
scheint sinnvoll, da gut trennende Merkmale (im Hinblick auf das gewählte Gütekriterium) in 
vielen Entscheidungsbäumen bevorzugt in Wurzelnähe gewählt würden und somit gleichar- 
tige Bäume im Wald herangezogen würden. Die Einschränkung begünstigt also eine größere 
Vielfalt der Bäume. 
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einem Blatt des Baumes, es findet also keine weitere Verzweigung statt. Ei- 
ne weitere Möglichkeit ist die Tiefe der Bäume des Waldes zu beschränken 
und das Training eines Baumes spätestens bei Erreichen der Maximaltiefe zu 
beenden. 


Für die Klassifikation erhält jeder Entscheidungsbaum b;(x) des RF den glei- 
chen Merkmalsvektor x und bildet ihn auf eine Klasse € Q ab. Die entspre- 
chende a-posteriori-Wahrscheinlichkeit ist gegeben durch’ [Bre01]: 


3|- 


m-1 
P(o|x) = — )) [bi(x) = o]. (5.21) 
i=0 


Alternativ kann auch über die geschätzten Wahrscheinlichkeiten gemittelt 
werden [Lia02]: 


m-1 


P(w|x) = L > P,(w|x). (5.22) 


Die geschätzte Klasse ô ist in beiden Fällen gegeben durch [Bre01]: 


W(x) = arg max P(w|x). (5.23) 
wen 


In [Stal4] wurde die Verwendung von RF-Modellen für eine medizini- 
sche Phasenerkennung am Anwendungsbeispiel einer laparoskopischen 
Cholezystektomie (Entfernung der Gallenblase, vgl. Kapitel 5.1.2) erstmals 
näher beleuchtet. Dabei wurden 7 verschiedene Phasen unterschieden. Die 
Lernstichprobe D für die Phasenerkennung umfasste 4 durchgeführte Ope- 
rationen mit bekannten Klassenzugehörigkeiten für jeden beobachteten 
Merkmalsvektor dieser Operationen. Die Klassenzugehörigkeiten wurden 


1 Hinweis: [-] stellt ein Prädikatabbildung dar, d.h. [-] hat einen Wert von 1, wenn der entspre- 
chende Ausdruck - als wahr ausgewertet wird. Dementsprechend wird ein Wert von 0 zuge- 
wiesen, wenn der Ausdruck als falsch ausgewertet wird. 
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durch medizinische Experten gesetzt. Nominale Merkmale waren die Ver- 
wendung von acht spezifischen Instrumenten (ja/nein), der Zustand des 
Operationslichts (an/aus) sowie der Zustand der Raumbeleuchtung (an/aus). 
Die Autoren erklären, dass RFs geeignet sind, da sie für Mehrklassenpro- 
bleme sehr gute Ergebnisse liefern und Phasen in a-typischer Reihenfolge 
vorhersagen können. Ersteres ist für realistische Arbeitsabläufe im Bereich 
der Medizin mit einer Anzahl an Phasen > 2 als sinnvoll zu betrachten (vgl. 
Kapitel 5.1 und insbesondere 5.1.2 sowie 5.1.1 für prototypische medizinische 
Interventionen). 


Letzteres, also die Vorhersage a-typischer Reihenfolgen von Phasen, ist eine 
Folge der Tatsache, dass ein RF zunächst nur einen einzigen Merkmalsvek- 
tor für die Klassifikation berücksichtigt - vgl. Gleichungen (5.21), (5.22) und 
(5.23). Wird der Merkmalsvektor nicht künstlich erweitert, so wie in der be- 
trachteten Arbeit von [Sta14], so bedeutet das de facto, dass ein Merkmalsvek- 
tor klassifiziert wird, ohne die Reihenfolge der Phasen zu berücksichtigen. Es 
wird also nicht eine Sequenz von Merkmalsvektoren modelliert und klassi- 
fiziert, sondern das Problem wird von einer Sequenz heruntergebrochen auf 
losgelöste, voneinander unabhängige Beobachtungen in Form von einzelnen 
Merkmalsvektoren, die unabhängig voneinander klassifiziert werden. 


Der in [Sta14] vorgestellte RF bestehend aus 50 Bäumen mit einer maximalen 
Tiefe von 4 Knoten und d’ = 4. Klassen, die durch ähnliche Merkmalswerte 
gekennzeichnet sind (und sich nur in der Reihenfolge des Auftretens unter- 
scheiden) können aufgrund der Modellierung nicht unterschieden werden. In 
[Sch16] erhalten die Autoren vergleichbare Ergebnisse für eine vereinfachte, 
7-phasige, endoprothetische Versorgung von Patienten mit einer Hüft-TEP - 
auch hier ist in den Konfusionsmatrizen eine hohe Verwechslung der Phasen 
zu beobachten die stark von der Reihenfolge abhängig sind. 


Hierbei handelt es sich um ein prototypisches Verhalten eines Klassifikators, 
der die Abfolge der Merkmalsvektoren nicht berücksichtigt. Daher ist die- 
ses Modell, ohne Modifikationen, hinsichtlich der Konstituenten des Problems 
(vgl. Kapitel 5.2) als wenig geeignet zu betrachten. Um den konzeptionellen 
Nachteil dennoch zu verringern, kann ein solches Modell in ein sequenzielles 
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RF zur Erkennung der 
Phase Portplatzierung vs. 
Drainage 


RF zur Erkennung der 
Phase Freipräparieren vs. 
Ektomie, Portplatzierung 


RF zur Erkennung der 
Phase Drainage vs. 
Wundverschluss 


RF zur Erkennung der 
Phase Ektomie vs. 
Portplatzierung 


Abbildung 5.15: Die Abbildung zeigt die Nutzung eines Random Forest, der in ein einfaches 
sequentielles Modell eingebettet ist. Ein RF wird verwendet, um die aktuel- 
le und mögliche nächste Phase vorherzusagen. (beispielsweise Freipräparie- 
ren mit möglichen nächsten Phasen Ektomie und Portplatzierung). Wenn eine 
nächste Phase vorhergesagt wird, findet ein Übergang statt. In Folge wird ein 
separater RF genutzt, um zwischen der neuen aktuellen Phase und möglichen 
nächsten Phasen zu unterscheiden. Wenn ein Übergang versehentlich gemacht 
wird, kann sich das Modell nicht mehr „fangen“. Daher wird ein globaler RF 
zur Unterscheidung zwischen allen (möglichen) Phasen verwendet, um das se- 


quentielle Modell zurücksetzen zu können. 


Modell eingebettet werden. Eine einfache Form eines derartigen Modells ist 


beispielsweise ein deterministischer Automat. 


In [Kat16] wird dieses Konzept (vgl. Abbildung 5.15) an zwei Anwendungs- 


beispielen illustriert: Zum einen eine Pankreasresektion (Abschneiden der 


Bauchspeicheldrüse), die 12 Klassen und eine Lernstichprobe mit 11 Opera- 


tionen umfasst. Zum anderen eine Adrenalektomie (Entfernung der Neben- 


nieren) mit 9 Klassen und einer Lernstichprobe von 5 Operationen. Berück- 


sichtigt werden die Verwendung eines spezifischen Instruments, die durchge- 


führte Aktion und der anatomische Aufbau. 
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Die Verwendung dieses sequentiellen Rahmenwerks (vgl. Abbildung 5.15) ist 
vergleichbar mit einem Verschieben eines Fensters über ein Modell eines Ar- 
beitsablaufs (vgl. Abbildung 5.16), wobei das Fenster allerdings nicht nur die 
aktuelle Phasen sondern zusätzlich mögliche nächste Phasen umfasst. 


Ein fensterspezifischer Klassifikator unterscheidet dann nur noch zwischen 
den Phasen innerhalb des Fensters, wie auch in in [Phi16a, Phi17a] dargestellt. 
Das Fenster wird nach vorne (entlang der gerichteten Kante) verschoben, so- 
bald eine nächste Phase vorhergesagt wird. 


RF zur Erkennung der 
Phase Portplatzierung 
vs. Drainage 


Ha 


Freipräparieren E Portplatzierung E Drainage 
EA 


Wundverschluss 


Ektomie 


Abbildung 5.16: Das in [Kat16] vorgestellte Rahmenwerk entspricht der Nutzung eines fenster- 
spezifischen Klassifikators. Das Fenster umfasst die aktuelle Phase und mégli- 
che nächste Phasen. Sobald eine der möglichen nächsten Phasen vorhergesagt 
wird, wird das Fenster entlang des Kontrollflusses verschoben. Bei diesem An- 
satz wird zwischen benachbarten Phasen diskriminiert und damit letztlich der 
Übergang zwischen den Phasen modelliert. 


Ein entscheidender Nachteil dieses Ansatzes ist die Verwendung von determi- 
nistischen Übergängen, die es notwendig macht, Strategien zum Zurücksetzen 
des sequentiellen Modells zu implementieren. Im dargestellten Falle geschieht 
dies mittels eines sogenannten globalen RF der wie in [Sta14] über alle Pha- 
sen, unabhängig der Reihenfolge, klassifiziert. Eine Verallgemeinerung des in 
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[Kat16] verwendeten deterministischen Automaten sind Petri-Netze (vgl. Ka- 
pitel 3.2). Diese werden im nächsten Abschnitt genauer beleuchtet. 


5.3.2 Petri-Netz 


Es gibt eine ganze Reihe von Gründen, Petri-Netze [Pet62] als ein Model- 
lierungswerkzeug für dynamische Aspekte eines Prozesses zu betrachten 
[van96, van98]. Im Hinblick auf das Anwendungsbeispiel können Petri-Netze 
aufgrund ihrer formalen Semantik, Abbildung von Nebenläufigkeiten und 
der Fülle von Analysetechniken von Nutzen sein. 


Für eine umfängliche Einführung in die Thematik der Petri-Netze sei auf Kapi- 
tel 3.2 verwiesen. Darin wurde die Netzstruktur eines Petri-Netzes ist gegeben 
durch das Tupel [Rei13] 


NST = (P,9,F), (5.24) 
wobei P die Menge der Plätze und Q die Menge der Transitionen sind 


P = {p; : i =0,...,|P|— 1}, 
Q = {qj : j =0,...,|Q|— 1}, 


so dass 
PAQ=Ø. 


Die Flussrelation F gibt die Verbindung von Plätzen und Transitionen (und 
umgekehrt) an: 


FC(PXO)U(OXP). (5.25) 


Um das dynamische Verhalten des Systems zu modellieren, werden so ge- 
nannte Marken eingeführt. Die Verteilung der Marken auf der Menge der 
Plätze stellt den Zustand des Petri-Netzes dar (vgl. Kapitel 3.2), die initiale 
Markierung ist dabei gegeben durch My : P > N. Sie kann auch kompakt 


138 


5.3 Stand der Technik 


in Vektor- oder Tupelform angegeben werden. Dabei repräsentieren die Ein- 
träge i des Vektors oder Tupels die Anzahl der Marken auf den Plätzen p;. 
Letztere Variante wird im Folgenden zur Vedeutlichung der Zusammenhänge 
gewählt‘. 


Nun werde ein Stochastisches Petri-Netz (SPN) definiert als ein Tupel 
SPN = (NST, Mo, £), (5.26) 


wobei £ = {A; : j = 1, ... ,|Q|} die Menge der Schaltraten A;, die den Transi- 
tionen qj zugeordnet sind [Mol81]. Dabei sind die Schaltzeiten | exponential- 
verteilt, genügen somit der kummulativen Verteilungsfunktion 


FD) =1- 6", (5.27) 


Das bedeutet, dass jeder Transition qj eine Schaltrate 4; € (0... 00) zugeord- 
net wird, deren Kehrwert dem Erwartungswert der Schaltzeit l entspricht. 


Zur Veranschaulichung zeigt Tabelle 5.3 eine graphische Repräsentation eines 
SPN mit 


P = {Po P1, Pa» P3» Pa}; 

Q = {g0, q1; 92, 93, q4}; 

F = {(po» 90); (qo; P1); (qo; P2) (P1; 91)» (P2; 92), (q1; P3), 
(a2; 94), (P3; q4), (P3; 93), (93, P1), (Pas 94), (Gas Po)}- 


Kreise stellen die Plätze und Rechtecke die Transitionen der Mengen P und 
Q dar. Die Flussrelation wird durch gerichtete Kanten (Pfeile) des Graphen 
visualisiert. Weiterhin gilt Mo(p,) = 1 sowie Mo(p;) = 0 Vi = 2,...,5. Die 


* Hinweis: Selten wird zur Angabe der Markierung eine Multimenge von Plätzen verwendet, 
hierin reprasentiert die Anzahl der Vorkommen eines Platzes die Anzahl der Marken, welche 
mit dem Platz assoziiert sind. Hierdurch kann die Nummerierung der Plätze entfallen, allerdings 
müssen der Name eines Platzes eindeutig sein 
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120) 


Abbildung 5.17: F(l) ist die kumulative Verteilungsfunktion einer Wahrscheinlichkeitsdichte- 
funktion f(l). Weiterhin is l die Schaltzeit, A~! ist der Erwartungswert der 
Schaltzeit, A € (0... 00). Die kumulative Verteilungsfunktion gibt an, wie 
wahrscheinlich es ist, dass bis zu einem Zeitpunkt eine Transition schon ge- 
feuert hat. 


Menge der zugeordneten Schaltraten ist gegeben durch 
L = {40,41,42,43, Aa}, 


wobei diese auf der linken Seite der Tabelle 5.3 aus Übersichtlichkeitsgründen 
weggelassen wurden. Die Anfangsmarkierung, also der anfängliche Zustand, 
ist in Tupelform gegeben durch (1,0,0,0,0,0). Sprich: der Zustand (1,0,0,0,0,0) 
des Erreichbarkeitsgraphen, vgl. rechte Seite der Tabelle 5.3, stellt den Zustand 
des links dargestellten SPN dar. Tabelle 5.3 veranschaulicht die Tatsache, dass 
ein SPN einen Markov-Prozess darstellt. 


Das bedeutet, die Zustände des Erreichbarkeitsgraphen des SPN entsprechen 
den Zuständen eines Markov-Prozesses und die Schaltraten Aj von Zustand 
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Tabelle 5.3: Die Tabelle zeigt ein SPN auf der linken Seite. Kreise stellen Plätze p; und Rechtecke 
stellen Transitionen qj dar. Der Zustand des SPN ist durch die aktuelle Verteilung 
der Marken (Markierung) gegeben. Im Erreichbarkeitsgraphen werden die Zustän- 
de durch Tupel dargestellt, wobei jeder Eintrag i die Anzahl der Marken an einem 
Platz pi repräsentiert. Die Abbildung veranschaulicht, dass ein SPN einen Markov- 
Prozess darstellt, wobei unter anderem die Schaltraten A j von Zustand Zm nach 
Zn im Erreichbarkeitsgraphen der Transitionswahrscheinlichkeit amn eines (dis- 
kreten) Markov-Prozesses entsprechen. In Anlehnung an [Bau02]. 


SPN Erreichbarkeitsgraph 


(1,0,0,0,0) <—— 


Po 
[à 
to 
(0,1,1,0,0) 
h, ‘i 
(0,0,1,1,0) (0,1,0,0,1) 


dy Ay 


(0,0,0,1,1) —14s 


Zm nach Z, des Erreichbarkeitsgraphen entspricht der Ubergangswahrschein- 
lichkeit amn eines (diskreten) Markov-Prozesses’. Das liegt u.a. daran, dass die 
Feuerraten exponentiell verteilt sind (vgl. Erinnerungslosigkeit) und damit die 
Markov-Eigenschaft [Bau02] erfüllt ist. 


* Hinweis: Amm wird so gesetzt, dass Amn = 1 gilt. 
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Die Verwendung von Markov-Modellen mit beobachtbaren Zuständen eignet 
sich in Fällen, in denen die Zustände des modellierten Systems direkt zugäng- 
lich sind. beispielsweise wird in [Phi15b] ein Entscheidungsunterstützungs- 
system für die Diagnose von zwei komplexen Krebserkrankungen mit Hilfe 
von Petri-Netzen modelliert. Das involvierte Dialogsystem ermöglicht einen 
direkten Zugriff auf die notwendigen Merkmale. Natürlich kann auch ein sol- 
ches Modell als sequentielles Modell verwendet werden, um ein Modell wie 
einen RF anstelle eines deterministischen Automaten einzubetten (vgl. Ab- 
schnitt 5.3.1). Im Hinblick auf die Konstituenten des Problems muss dieses 
Modell jedoch erweitert werden, beispielsweise durch die Einführung verbor- 
gener Zustände. 


5.3.3 Hidden Markov Model (HMM) 


Ein HMM [Rab86] ist ein Markov-Modell, das einen Markov-Prozess mit ver- 
borgenen, also nicht beobachteten, Zuständen repräsentiert. Das heißt, im Ge- 
gensatz zu Markov-Prozessen, bei denen der Zustand des Modells zu einem 
Zeitpunkt t durch dessen direkt beobachtbare Zustände bekannt ist, kann ein 
Beobachter in einem HMM nur auf Emissionen zugreifen, die durch die ver- 
borgenen Zustände erzeugt werden. 


Um dies zu ermöglichen, ist neben der Menge der Zustände und den Zustands- 
übergangswahrscheinlichkeiten auch ein Beobachtungsmodell, repräsentiert 
durch ein Ausgabevokabular als auch Emissionswahrscheinlichkeiten, Teil ei- 
nes HMM. 


Formal ist ein (diskretes) HMM gegeben durch das 5-Tupel' 


HMM = (S, K, A, B, 7). (5.28) 


1 Hinweis: Dieses Quintupel wird in der Literatur häufig auch als A = (8, V, A, B, m) bezeich- 
net. Um Verwechslungen zu vermeiden, sind die Tupel der verschiedenen Modelle in dieser 
Ausarbeitung mit sprechenden Bezeichnern versehen. Also in diesem Falle: HMM statt A. 
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Dabei ist S = {so, ... , Sn—-1} die Menge der verborgenen Zustände des HMMs 
und H = {họ, ..., hm-1} die Menge möglicher Emissionen dieser Zustände. 
Letzteres wird auch als Ausgabevokabular bezeichnet. Darüber hinaus exis- 
tiert eine Ubergangsmatrix A E€ R"*", die die Ubergangswahrscheinlichkei- 
ten von einem aktuellen Zustand s; zu einem nächsten Zustand s; durch den 
Matrixeintrag a; j; bündelt. Die Matrix B E R"””* enthält die Emissionswahr- 
scheinlichkeiten eines Zustandes s; durch die entsprechenden Zeileneinträge 
bij : j = 0,...,m — 1. Schließlich enthält der Vektor z € R” die Anfangs- 
zustandswahrscheinlichkeiten, also die Wahrscheinlichkeit, dass ein Zustand 
der Anfangszustand ist. 


Die Verwendung eines HMM für eine medizinische Phasenerkennung wurde 
in [Blu08] am Anwendungsbeispiel einer laparoskopischen Cholezystektomie 
(vgl. Kapitel 5.1.2) herausgearbeitet. Im Zusammenhang mit dieser Opera- 
ton wurden 14 Phasen betrachtet. Die originale Lernstichprobe umfasste 12 
aufgezeichnete Beobachtungssequenzen der chirurgische Eingriffe. Nominale 
Merkmale waren die Verwendung von 17 spezifischen Instrumenten (ja/nein). 
Die Autoren stellten ein HMM mit 14 Zuständen sowie ein aggregiertes HMM 
vor. In Letzterem wurden ähnliche Zustände in einen einzigen Zustand über- 


führt. 


In [Pad08] wird ebenso eine Cholezystektomie mit 14 Phasen betrachtet. Das 
Trainingsset umfasste 11 chirurgische Eingriffe. Nominale Merkmale waren 
die Verwendung von 18 spezifischen Instrumenten (ja/nein) einschließlich des 
Zustands eines optischen Geräts (eingesetzt/nicht eingesetzt). 


Ein HMM kann als ein klassisches, sequenzielles Modell gesehen werden, das 
die Konstituenten des Problems berücksichtigt (vgl. Abschnitt 5.2). Dennoch 
ist die Struktur dieses Modells wenig geeignet, um Expertenwissen über Emis- 
sionswahrscheinlichkeiten einzubeziehen. 


Das liegt auch daran, dass die entsprechende Wahrscheinlichkeitsverteilung 
nicht faktorisiert werden kann und daher exponentiell mit der Anzahl der 
möglichen Emissionen wächst. Um diesen Nachteil zu überwinden, kann die 
Verallgemeinerung eines HMM, nämlich ein DBN, verwendet werden. 
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5.3.4 Dynamisches Bayes-Netz (DBN) 


Ein DBN ist ein probabilistisches graphisches Modell (PGM), das graphen- 
theoretische Ansätze mit Ansätzen der Wahrscheinlichkeitstheorie verbindet. 
Wie in Kapitel 2.4.5 erläutert, ist ein DBN gegeben durch das Tupel 


DBN = (B,,B_). (5.29) 


Dabei bündelt Bọ die Struktur sowie die a-priore Wahrscheinlichkeitsvertei- 
lung über den Zufallsvariablen X ,., in Zeitschritt 0. Darüber hinaus wird B_, 
genutzt um die bedingte Walrscheinlichkeitsverieilüng über diskrete Zeit- 
schritte t zu spezifizieren: 


POC IXS b= re: |Pa(X})). (5.30) 


Die gemeinsame Wahrscheinlichkeitsverteilung ist gegeben durch [Mur02]: 


PO = (M Pappa?) JPA; xD (5.31) 
i=0 t=1 i=0 
=][[[ P&P). (5.32) 
t=0 i=0 


Zur Verdeutlichung der Zusammenhänge kann ein DBN auch in einer soge- 
nannten ausgerollten Form dargestellt werden (vgl. Kapitel 2.4.5, Abbildungen 
2.5 bis 2.7). In diesem Zusammenhang dient Bo als Startverteilung in Zeit- 
schritt 0 und BJ als Schablone für alle weiteren Zeitschritte - vgl. auch Glei- 
chung (5.32). 


Abbildung 5.18 zeigt links einen beliebigen Zeitschritt einer ausgerollten 
DBN-Struktur, welche ein HMM repräsentiert. Bezogen auf die Konstitu- 
enten des Problems (vgl. Kapitel 5.2), stellt der mit der Wurzel assoziierte 
Wertebereich der Zufallsvariablen Val(X A die einzelnen Phasen dar. 
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Abbildung 5.18: Die Abbildung zeigt links ein HMM, das durch eine DBN-Struktur dargestellt 
wird. Es gibt einen Wurzelknoten, der ein Phase repräsentiert, und einen Kind- 
knoten, der die Emissionen gegeben eine Phase repräsentiert: P(X i Xo) Die 
zur Spezifizierung einer bedingten Wahrscheinlichkeitsverteilung dieses Kind- 
knotens erforderlichen Parameter wachsen exponentiell mit der Anzahl der 
verwendeten Merkmale, d.h. mit der Größe des Merkmalsvektors xt. Auf der 
rechten Seite der Abbildung ist eine DBN-Struktur dargestellt, die sich die be- 
dingte Unabhängigkeit der Merkmalswerte x; des Merkmalsvektors x! zunut- 
ze macht, um das Wachstum der Parameter zu reduzieren: Im dargestellten Fall 


wächst die Anzahl der Parameter linear mit der Größe von xt. 


Der Wertebereich des einzigen Kindknoten umfasst sämtliche Merkmalswer- 
tekombinationen, die beobachtet werden können - sprich: das Ausgabevoka- 
bular bzw. alle möglichen Ausprägungen des Merkmalsvektors x, die einem 
Beobachter zur Verfügung stehen. Die Strukturen von Bo sowie B_, entspre- 
chen denen in den Abbildungen 2.5 bis 2.7 aus Kapitel 2.4.5 - allerdings mit 
einem einzigen Kindknoten X, der jeweils alle Emissionen bündelt. Die For- 
meln (5.29) bis (5.32) ergeben sich entsprechend. 


Durch die Einführung einer bedingten Unabhängigkeit zwischen den Merk- 
malswerten (vgl. Abbildung 5.18, rechte Seite) kann ein naives DBN kon- 
struiert werden. Die entsprechende Wahrscheinlichkeitsverteilung der Kinder 
ist durch I, P(X |X A) gegeben. Jede dieser Kinder repräsentiert dabei ein 
Merkmal x; des Merkmalsvektors x. Es ist leicht zu erkennen, dass im ersten 
Fall die Anzahl der Parameter exponentiell wächst, während dies im zweiten 
Fall linear stattfindet. 


Seien beispielsweise 7 verschiedene Phasen gegeben - mithin gilt also: 
[Vaxt] = 7. Weiterhin wird zu jedem Zeitschritt t ein Merkmalsvektor x 
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mit Dimension d = 3 beobachtet, d.h. x! = (x$, x$, x$)". Jedes der drei Merk- 
male habe zudem 4 verschiedenen Merkmalswerte, welche angenommen 
werden können. Dann ist die bedingte Wahrscheinlichkeit für das Vorliegen 
einer konkreten Ausprägung eines Merkmalsvektors gegeben die Phase, also 
P(X, |X,), gegeben durch: (4-4-4) -7 = 448 Parameter. Hiervon müssen 441 
angegeben werden, weil sich die Wahrscheinlichkeitswerte zu 1 summieren. 
Auf der anderen Seite ist IL-, P(X,|X,,) gegeben durch (4 + 4 + 4) - 7 = 84 
Parameter, von denen 63 spezifiziert werden müssen. Weitere Einzelheiten 
finden sich in [Phi17d]. 


Diese Reduzierung der Parameter kann nützlich sein, wenn nur eine kleine 
Menge an Trainingsdaten zur Verfügung steht [Kol09]. Darüber hinaus er- 
möglicht die spezielle Struktur des Netzes eine sinnvolle expertenbasierte Pa- 
rametrisierung und damit die Einbeziehung des Expertenwissens in die Mo- 
delle - was auch beim Umgang mit kleinen Mengen von Trainingsdaten und 
im Zusammenhang mit Übersetzungs- und/oder Fusionsmechanismen von 
Ablaufmodellen nützlich sein kann [Phi15c, Phi16b, Phi17d]. 


5.3.5 Zusammenfassung 


Die wichtigsten Eigenschaften der vorgestellten Modellierungsansätze der 
vorangegangenen Kapitel 5.3.1 bis 5.3.4 sind in Tabelle 5.4 kompakt visuali- 
siert. 


Dabei zeigen die RF ein prototypisches Verhalten eines Klassifikators, der die 
Sequenz der Merkmalsvektoren x! während der Klassifikation nicht berück- 
sichtigt. Auch wenn dieser konzeptuelle Nachteil abgefedert werden kann - 
beispielsweise indem der Klassifikator in ein sequentielles Modell eingebettet 
wird oder Merkmalsvektoren gestapelt werden - sind die RFs der Kategorie 
der nicht-sequentiellen Modelle zuzuordnen. 


Weiterhin erlauben RF nicht die Modellierung verborgener Zustände, was 
notwendig sein kann um die Tatsache zu repräsentieren, dass ein Beobach- 
ter keine direkten Zugriff auf den Zustand des modellierten Systems hat. 
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Darüber hinaus ist ein RF ein diskriminatives Modell, welches eine Klassifi- 
kation zur Laufzeit (engl. online) ermöglicht. Letztere ist notwendig um eine 
Phasenerkennung unter Kenntnis der bisher beobachteten Merkmalsvekto- 
ren aber ohne Kenntnis der noch zukünftig kommenden zu ermöglichen (vgl. 
Kapitel 5.2). 


Ein SPN repräsentiert einen Markov Prozess (vgl. Section 5.3.2). Das Modell 
ist geeignet um sequentielle Abhängigkeiten für Systeme zu modellieren, in 
denen der interne Zustand für einen Beobachter direkt sichtbar ist (beispiels- 
weise in Dialogsystemen). Bei einem SPN handelt es sich um ein generati- 
ves Modell, welches eine Klassifikation zur Laufzeit erlaubt - ein datenge- 
triebenes Einlernen ist beispielsweise über genetische Algorithmen möglich. 
Schließlich ist eine expertenbasierte Parametrisierung möglich - in der Pra- 
xis kann allerdings die Größe des Modells schnell zu einem limitierenden Fak- 
tor werden. In der praktischen Verwendung können deswegen Erweiterungen 
der Petri-Netze, beispielsweise in Form von gefärbten Petri-Netzes, notwen- 
dig werden. 


Ein HMM kann als ein typisches, gut erforschtes sequentielles Modell ge- 
sehen werden. Ein HMM erlaubt die direkte Modellierung von verborgenen 
Zuständen, welche bezüglich der Konstituenten des Problems als notwendig 
betrachtet werden muss (vgl. Kapitel 5.2). Es handelt sich um einen genera- 
tiven Ansatz der zur Klassifikation zur Laufzeit geeignet ist. Allerdings ist 
die Struktur der Modells nicht geeignet um Expertenwissen über praxisrele- 
vante Emissionswahrscheinlichkeiten einzubringen. Das liegt unter anderem 
daran, dass die entsprechende Wahrscheinlichkeitsverteilung im HMM nicht 
faktorisiert werden kann und deswegen exponentiell mit der Anzahl der be- 
trachteten Emissionen steigt. 


Um diesen Nachteil zu überwinden können DBNs eingesetzt werden, die eine 
Verallgemeinerung der HMM darstellen. DBNs erweitern bzw. verallgemei- 
nern das Modell um die Möglichkeit den Zustandsraum in faktorisierter Form 
dazustellen und nicht nur in Form einer einzelnen Zufallsvariablen (vgl. Ka- 
pitel 5.3.4, Abbildung 5.18). Dies erlaubt es, die Parameter zu reduzieren, was 
die Interpretierbarkeit und Modularität verbessert. 
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Tabelle 5.4: Die Tabelle zeigt verschiedene Modellierungsansätze die in diese Arbeit besprochen 
werden. Die Symbole ll / O werden genutzt um darzustellen dass die entsprechende 
Eigenschaft vorhanden / nicht vorhanden ist. 


RF | SPN | HMM | DBN 
Sequentielles Modell a a a 
Verborgene Zustände a a 
Generativer Ansatz a a a 
Klassifikation zur Laufzeit a a a a 
Datengetriebenes Training a a a a 
Expertenbasierte Parametrisierung a a 
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Dies erlaubt die Etablierung eines praxistauglichen Weges zur Einbringung 
von Expertenwissen in ein DBN. Weiterhin können mit DBNs, im Gegensatz 
zu Kalman Filter Modellen, beliebige Wahrscheinlichkeitsverteilungen (und 
nicht nur unimodale, lineare Gaußverteilungen) festgelegt werden. Ein DBN 
ist in Summe eine vielversprechendes Modell, da es eine Abwägung zwischen 
Ausdrucksstärke und Komplexität erlaubt und bewährte probabilistische Mo- 
delle wie HMM durch seine Verallgemeinerung mit umfasst. 


In jüngster Zeit rücken Künstliche Neuronale Netze (KNN) auch für den Be- 
reich der medizinischen Phasenerkennung in den Fokus des Interesses. Bei- 
spielsweise wird in [Li16] ein Faltendes Neuronales Netz (engl. Convolutional 
Neural Network) (CNN) verwendet, um drei Phasen am Anwendungsbeispiel 
einer Wiederbelebungsmaßnahme mit 3 Phasen zu erkennen. Zum Einlernen 
des Klassifikators wurden 20 Arbeitsabläufe in Form von Tiefenbildern und 
Tonaufnahmen genutzt. Das Modell wurde dann über Schwellwerte in ein ein- 
fache sequentielles Modell eingebettet - dies entspricht der Vorgehensweise 
aus Kapitel 5.3.1. 


In [Twi17] wird ebenso ein CNN betrachtet - Anwendungsbeispiel ist hier 
eine Cholezystektomie mit 7 Phasen. Für das Training wurden 80 Eingriffe 
betrachtet. Die Autoren nutzen das CNN zur Merkmalsextraktion aus Video- 
endoskopaufnahmen. Mit den gewonnen Merkmalen wurde ein HMM einge- 
lernt, welches eine Genauigkeit bei der Phasenerkennung von 82% erreichte 
— vermehrte Fehlklassifikationen traten an einer Verzweigungen des betrach- 
teten Arbeitsablaufes auf. 


Schließlich beleuchten die Autoren in [Li17] das Anwendungsbeispiel einer 
Wiederbelebungsmaßnahme - hier wird ein CNN als Merkmalsextraktor für 
Tiefenbilder, Tonaufnahmen und Posen von Instrumenten genutzt. Nachge- 
schaltet kommt zur sequentiellen Modellierung ein Rekurrentes Neuronales 
Netz (RNN) mit spezieller Speicherarchitektur - einem sogenannten langem 
Kurzzeitgedächtnis (engl. Long Short-Term Memory) (LSTM) zum Einsatz. 
Zum Training werden 42 verschiedene Aufnahmen von Wiederbelebungs- 
maßnahmen verwendet. Der Fokus der Arbeiten liegt dabei aber nicht auf 
einer tatsächlichen Phasenerkennung (vgl. Kapitel 5.2), sondern in der Erken- 
nung 35 verschiedener Einzelaktivitäten. 
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Im Hinblick auf die Konstituenten des Problems (vgl. Kapitel 5.2 können KNN 
als Merkmalsextraktoren verwendet werden (z.B. bei Tiefenbildern). Aller- 
dings liegen für die medizinischen Anwendungsfälle vergleichsweise wenig 
Trainingsdaten vor — was einen sinnvollen Einsatz der KNN erschwert. Auch 
wenn die betrachteten medizinischen Anwendungsfälle eher datenarm sind, 
so existiert jedoch in deren Umfeld ein reichhaltiges Wissen - sie sind also 
wissensreich. Ein Grund hierfür ist die Existenz einer Vielzahl an medizini- 
schen Experten, die in diese Anwendungsfälle involviert sind. 


5.4 Transformation eines FHIR-Plans in ein 
DBN zum Abgleich chirurgischer 
Interventionen 


Im folgenden Unterkapitel 5.4.1 werden zunächst FHIR-Pläne als Ausgangs- 
modell erläutert. Danach wird in Unterkapitel 5.4.2 auf DBNs als Zielmodell 
eingegangen. Schließlich wird in Unterkapitel 5.4.3 vorgestellt, wie ein FHIR- 
Plan in ein DBN zur chirurgischen Phasendetektion transformiert werden 
kann. Die Vorgehensweise bettet sich in das in Kapitel 4.1 vorgestellte Ge- 
samtkonzept ein, vgl. Abbildung 4.1 auf Seite 82. 


5.4.1 FHIR-Plan als Ausgangsmodell 


Ausgangspunkt der Transformation sei ein FHIR Plan einer chirurgischen In- 
tervention, welcher durch einen Graphen H = (K, M) mit Knotenmenge K 
und Kantenmenge M gegeben sei. Die Knotenmenge X lasse sich partitionie- 
ren in die folgenden disjunkten Knotenmengen: 

« J: Menge der elementaren Aktionen, 

e Jr: Menge der stillen Aktionen, 


e G_: Menge der gruppierenden Aktionen für Sequenzen, 


e G,: Menge der gruppierenden Aktionen für Entscheidungen, 
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* Gcy: Menge der gruppierenden Aktionen für Iterationen, 
* Otnp: Menge der Dateninputs, 


* Oout: Menge der Datenoutputs. 


Zudem beschreibe G = G_, U 9x U Gœ die Menge aller gruppierenden Aktio- 
nen. 


Weiterhin gebe es spezielle Aktionen Jstart und Jgnde aus der Menge der ele- 
mentaren Aktionen J, welche die eindeutigen Start- und Endaktionen des 
FHIR-Plans markieren. 


Die Menge der gerichteten Kanten des FHIR-Plans sei gegeben durch: 


M =fle,,ej)|lei,e;)E(K\ (inp U Oout)) X K, ej # ej}. 


Es existieren also keine Kanten ausgehend von Dateninputs oder Datenout- 
puts. Dariiber hinaus gibt es keine Kanten von einem Knoten zuriick in sich 
selbst - der Graph ist also frei von Schlingen (schlingenfrei). 


Die Kanten M können weiter partitioniert werden in: 


e Msn: Menge der Kanten, die gruppierende Aktionen mit ihren Subak- 
tionen verbinden, 


e Myo: Menge der Kanten, die repräsentieren, dass eine Aktion vor dem 
Ende einer anderen Aktion ausgeführt werden muss (before-end), 


e Myach: Menge der Kanten, die repräsentieren, dass eine Aktion nach 
dem Ende einer anderen Aktion ausgeführt werden muss (after-end), 


e Minp: Menge der Kanten, die Aktionen mit ihren zugehörigen Datenin- 
puts verbinden, 


e Moy: Menge der Kanten, die Aktionen mit ihren zugehörigen Daten- 
outputs verbinden. 


Zudem sei als Hilfe für die spätere Transformation folgende Knotenmenge 
definiert: 
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+ Descy, (8): Nachfahren des Knoten g € 9 bezüglich des Teilgraphen 
Hs,» mit Knotenmenge K und Kantenmenge Msup. Diese Menge gibt 
alle direkten und indirekten Subaktionen einer gruppierenden Aktion 
gan. 


e Pay, „(K): Elternknoten eines Knotens k € K bezüglich des Teilgra- 
phen Hg, mit Knotenmenge K und Kantenmenge M sup- 


5.4.2 DBN als Zielmodell 


Ziel der Transformation sei ein DBN (vgl. Kapitel 2.4.5) welches gegeben ist 
durch das Tupel 


DBN = (Bp, B). 


Hierbei sind By und B_, ihrerseits Bayes-Netze. By = (Go, P) gibt die Struk- 
tur, sowie die a-priori Wahrscheinlichkeitsverteilung tiber den Zufallsvaria- 
blen in Zeitschritt 0 an. B, = (G_,,P.,) spezifiziert Struktur als auch die be- 
dingte Wahrscheinlichkeitsverteilung über zwei diskrete Zeitschritte t und 
t — 1 hinweg. 


Die Knotenmenge des DBN lasse sich aufteilen in: 


+ Vp: Knoten des Graphen Go, 
+ V5_: Knoten des Graphen G_,. 


Weiterhin gebe es in den Knotenmengen jeweils ausgezeichnete Wurzelkno- 
ten Vwurz E VB, und’ VWur, E Ve. 


Die Kantenmengen des DBN seien gegeben durch: 


+ Ep,: Kanten des Graphen Go, 
e €p_: Kanten des Graphen G_,. 


* Hinweis: Das Symbol * wird hier verwendet um Mehrdeutigkeiten zu vermeiden und um einen 
Knoten zu markieren, der zum Zeitschritt t des Graphen B_, gehört (vgl. Beispiel eines 2TBN 
in Abbildung 2.6 auf Seite 32). 
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Mithilfe der Wurzelknoten können die Kantenmengen wie folgt gebildet wer- 
den: 


EB, = ({Uwarz} x (Va, \ {Uwurzs) ) ’ 
€ = ({UWares x (Vz, \ (Wurzd)) U ({Uwares x {DWurzs ) : 


Sprich: die Wurzelknoten sind also jeweils mit ihren Kindknoten verbunden, 
weiterhin sind die Wurzelknoten zweier aufeinanderfolgender Zeitschritte 
durch eine Kante verbunden (vgl. Abbildung 2.7 auf Seite 33). 


Neben den Knoten- und Kantenmengen, welche die Struktur des DBN festle- 
gen, sind die bedingten Wahrscheinlichkeitsverteilungen von Bedeutung (vgl. 
Kapitel 2.4.5). Diese lassen sich fiir ein DBN mit k Kindern wie folgt aufteilen 
(vgl. Abbildung 2.7 auf Seite 33 und [Phi17a]): 


PL =) =20 (5.33) 

P(X, = IX) =D =AGI (5.34) 
P(X) = {|X =) = BGS) (5.35) 
PE ESj SSR ip (5.36) 


Dabei zeigt (5.33) die initiale Wahrscheinlichkeitsverteilung, die mit dem 
Wurzelknoten X, zum Zeitschritt £ = 0 assoziiert ist, sprich: X . Folglich 
bündelt der Vektor z(i) die a-priori Wahrscheinlichkeiten der jeweiligen 
Werte von x . Hinweis: Das Ergebnis X = i ist eine Kurzschreibweise für 
das Ereignis w € Q : fx(w) = i. Dabei ist Q die Ergebnismenge und fx(®) 
bildet ein Ergebnis w auf mögliche Werte der Zufallsvariablen X ab. Dieser 
Wertebereich von X ist durch Val(X) gegeben. In Verbindung mit P(-) ergibt 
sich so P(X = i), vgl. Kapitel 2.4.2. Im gegebenen Falle beinhaltet Val(X) 
die möglichen Phasen der chirurgischen Intervention, d.h. die möglichen 
Zustände. 
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In (5.34) ist die Wahrscheinlichkeit angegeben, um von einem Zustand i eines 
Zeitschrittes in einen Zustand j des darauffolgenden Zeitschrittes überzuge- 
hen (Übergangswahrscheinlichkeit). Das bedeutet, dass Matrix A(i,j) letztlich 
eine Adjazenzmatrix widerspiegelt, welche für Einträge > 0 mit Übergangs- 
wahrscheinlichkeiten erweitert wurde, vgl. hierzu auch die Kapitel 5.3.2 und 
5.3.3 sowie 5.3.4. 


(5.35) und (5.36) zeigen die Emissionswahrscheinlichkeiten eines Zustandes 
i. Im Unterschied zu einem HMM werden diese Wahrscheinlichkeiten aber 
nicht in einer einzige Matrix B(i,j) gebündelt, vgl. Kapitel 5.3.3 und [Phi17a] - 
vielmehr werden die Wahrscheinlichkeitsverteilungen in faktorisierter Form, 
hinterlegt. Sprich: Jede Emission oder jedes Merkmal hat einen eigene Vertei- 
lung gegeben den jeweiligen Zustand des Elternknotens. 


5.4.3 Transformation eines FHIR-Plans in ein DBN 


Zur Transformation eines FHIR-Plans H = (K,M) in ein DBN werde zu- 
nächst eine surjektive Funktion definiert, welche die Menge (Omp U Oout) der 
Dateninput- und Datenoutputknoten des FHIR-Plans auf eine Teilmenge der 
Knoten des DBN abbildet: 


Amap : (Omp U Oou) == ( Vz, \ {Owarzt) d (5.37) 


Bei Amap handele es sich um eine surjektive Abbildung, welche Datenin- und 
outputknoten o mit den selben Namen, d.h. gleichen Inhalts des Attributs text, 
auf den gleichen Knoten im DBN abbildet: 


Amap(01) = Amap l02) <> 01.text = O,.text (5.38) 


In der Knotenmenge Vg, des DBN gibt es also für jeden eindeutigen Namen 
der Dateninput- und -outputknoten des FHIR-Plans einen entsprechenden 
Knoten. 


Der Wurzelknoten Vwurz ist der einzige Knoten aus Vg,, der von Ayame nicht 
getroffen wird und kein Urbild innerhalb des FHIR-Plans besitzt. Dieser Kno- 
ten wird separat erzeugt. 
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Weiterhin gebe es eine surjektiveFunktion hy, mit 


Rap : (Onp U Oout) Ei ( VB, \ Wiwurz} ) ’ (5.39) 


welche jeden Dateninput- und Datenoutputknoten des FHIR-Plans auf Part- 
nerknoten im Graphen G_, abbildet. Auch hier werde der Wurzelknoten UWy,, 
spater separat erzeugt und es gelte: 


ANtap(O1) = AMap(02) © 01.text = 07.text (5.40) 


Mithilfe der Funktionen Amap und hy.p, sowie weiteren deterministischen 
Transformationsregeln können schließlich die Graphen Gg und G_ des DBN 
wie folgt generiert werden: 


VB, ={hmap(0) |0 E Ocode } UL Uwurz $5 (5.41) 
Vg, ={ AM (0) |0 E Ocode $ U {VWurz} U VB, » (5.42) 
EB, = { (Uwaurz Amap(O)) |O E Ocode $> (5.43) 
Eg, = { (VWwurz AMap(O)) |0 E Ocode $ U { (Uwurz VWurz) } - (5.44) 


Zunächst wird in (5.41) die Knotenmenge des Graphen Go des DBN erzeugt. 
Hierzu wird jedem eindeutigen Code eines Dateninputs und Datenoutputs des 
FHIR-Plans. 


Sprich: jedem Element aus der Menge Ocode — ein entsprechender Knoten aus 
der Knotenmenge Vg, des DBN zugeordnet. Weiterhin ist der ausgezeichnete 
Wurzelknoten Uy,,,,, der kein Urbild im FHIR-Plans besitzt, Teil der Knoten- 
menge von Go. 


Anschließend werden in (5.42) mithilfe der Funktion h},,, in gleicher Weise 
die Knoten des Graphen G_, des DBN erzeugt. Zusätzlich sind Viyurz und Vg, 
Teil der Knotenmenge Vz. 


Die Kantenmengen werden in (5.43) und (5.44) erzeugt. Hierbei wird in (5.43) 
zunächst die Kantenmenge Eg, erzeugt, indem der Wurzelknoten mit jedem 
anderen Knoten der Knotenmenge Vg, über eine Kante verbunden wird. 
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Ebenso wird in (5.44) für die Kantenmenge €g_ verfahren: Auch hier wird 
eine gerichtete Kante vom Wurzelknoten zu jedem der anderen Knoten der 
Menge Vg _, gezogen. 


Weiterhin miissen noch Kanten tiber die Zeitschritte hinweg erzeugt werden. 
Hierfiir werden die Wurzelknoten benachbarter Zeitschritte verbunden. 


Nachdem die Struktur des DBN erzeugt ist, muss nun noch dessen Parame- 
trierung erfolgen. Zunächst werden dabei diejenigen Werte der (diskreten) 
Zufallsvariablen festgelegt, die durch die Knoten Uy,, und Vwurz repräsen- 
tiert werden. 


Seien x die Zufallsvariablen, die für einen Zeitschritt t mit U\y,,, assoziiert 


sind und x die Zufallsvariablen, die zum Zeitschritt t — 1 durch vw,,, re- 
präsentiert werden. Die Werte, die diese Zufallsvariablen annehmen können, 
entsprechen natürlichen Zahlen, wobei jedem möglichen Prozessschritt, der 
durch eine Aktion repräsentiert wird, eine eindeutige natürliche Zahl zuge- 
wiesen wird. Dies geschieht durch eine bijektive Funktion: 


hy : 4 > {0,....n-1} mit n= |J|. (5.45) 


Ohne Beschränkung der Allgemeinheit wird angenommen, dass die von hy 
zugewiesenen Zahlen einer lexikographischen Ordnung entsprechen. Man er- 


hält: 
Val(X,)={hrtu)|ued}, 


val (Xt >) ={hy(u)|u €}, 


wobei Val(-) die Wertemenge angibt, die die jeweilige Zufallsvariable anneh- 
men kann. 


Für die anderen Zufallsvariablen X > die den Kindknoten von vy,,, und 
Uwurz Zugeordnet sind, wird eine Bernoulli-Verteilung verwendet, d.h.: 


Val(X;) = {0,1}, 
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wobeii = 1,...,m mit m = | Vg_\ ({VWyurz$ U VB, ) |. Außerdem werden die 
Startverteilung und die CPD der Beobachtungen und der Zustandsübergänge 
festgelegt. Dabei ist der Vektor der Anfangszustandwahrscheinlichkeiten 7 
gegeben durch: 


1, falls u © Ian, 
nine? eo (5.46) 


0, sonst. 


Wobei durch hy wie in Gleichung (5.45) definiert, jeder Aktion j € J eine 
eindeutige natürliche Zahl zugeordnet wird. 


Da es nur einen dedizierten Startzustand gibt, ist die Wahrscheinlichkeit für 
dessen Auftreten als Anfangszustand 1. Allen anderen Zuständen wird eine 
Wahrscheinlichkeit von 0 zugeordnet (5.46). 


Die Wahrscheinlichkeitsverteilung der Zustandsübergänge ist durch (5.47) ge- 
geben. Ihre Darstellung entspricht einer Adjazenzmatrix mit den Übergangs- 
wahrscheinlichkeiten als Kantengewichten. Dabei sind die Einträge A(i, j) der 
Matrix A mit i = hy (u) und j = hy (V) gegeben. 


Hierbei gibt der Wert u.du die Dauer an, die der Aktion u € J über das At- 
tribut action.timing.timingDuration in FHIR zugeordnet ist. Der Wert v.trans 
gibt die Wahrscheinlichkeit eines Ubergangs in die Aktion v an und ist in 
FHIR über das Attribut action.transition gegeben. 


In (5.47) wird in den ersten beiden Fällen die Übergangswahrscheinlichkeit 
von einer Aktion zurück zu sich selbst gesetzt - sprich die Wahrscheinlichkeit 
in dieser Aktion zu bleiben. Dabei muss unterschieden werden, ob es sich um 
eine Endaktion handelt oder nicht. 


Für eine Endaktion ist kein weiterer Übergang in eine Folgeaktion möglich. 
Die Übergangswahrscheinlichkeit aus einer Endaktion heraus ist somit 0. Um- 
gekehrt ist die Wahrscheinlichkeit in der Endaktion zu verbleiben 1. Für eine 
Aktion mit Folgeaktion wird die Wahrscheinlichkeit in dieser Aktion zu ver- 
bleiben mithilfe deren Dauer u.du berechnet. 
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In den folgenden Fällen wird schließlich die Übergangswahrscheinlichkeit 
von einer Aktion u in eine andere Aktion v gesetzt. Dabei kommt es darauf 
an, wie die beiden Aktionen u und v miteinander verschaltet sind. 


Zunächst werden sequentiell miteinander verschaltete elementare Aktionen 
betrachtet - vgl. dritter Fall in (5.47). Solcherlei Aktionen sind im FHIR-Plan 
durch Kanten aus der Menge Myach direkt verbunden. Die Wahrscheinlichkeit 
in die Folgeaktion zu wechseln ist gerade durch die Gegenwahrscheinlichkeit 
des zweiten Falles gegeben. 
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A(i,j) = 


1, 
u.du-1 
u.d i 
u.du— 
1- ’ 
u.du 
u.du-1 
(1- 
u.du 
- v.trans, 
u.du-1 
1:— 
u.du 
u.du-1 
udu ” 


G- 


u.du—1 


u.du 


- T.trans, 


) 


falls u = v, u E Ipnde 
falls u = v, u € (J \ Jende) 
falls u # v, {u,v} C J, (v, u) E Myach 


falls u # v, {u,v} C J, 
A(g,u) € Myach 8 € G,V € Descy, „ (8), 
Alki, k2) E Myachs ky € Wr.» k EK 


falls u # v, {u,v} C J, 


A(v,g) E Mach: 8 E G,u E Desc, (8), 
Alki, k2) € Myacn K2 E Wir. sky E K 


falls u # V, {u,v} C J, iG, u), (v,t)} c M Nach» TE I 


falls u # v, {u,v} C J, 

A(g1,U) € Mach: 81 E 9,7 € Descy, (81) N Jr 
Alka, k2) € Mach, ki E Win, ka © K, 

AV, £2) € Myach, V € Desch, , (81), 82 = Palt) 


falls u # v, {u,v} C J, 

3w,g1) € Myach> & € 3.06 Descpy, (81), 
A(ky, k2) E€ Myachs K2 € Win, ‚kı E K 
A(g2,U) € Mynach 82 = Pa(t),u € Descry,, (81) 
sonst 


(5.47) 
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Eine weitere Verschaltungsmöglichkeit behandelt der vierte Fall: Sind zwei 
elementare Aktionen u und v über „Umwege“ sequentiell miteinander ver- 
schaltet, d.h. liegt v im Inneren eines auf u folgenden selektiven oder ite- 
rativen Verschaltungsblocks, dann gibt es im FHIR-Plan keine direkte Kante 
zwischen u und v. Vielmehr ist in diesem Fall u sequentiell mit einer gruppie- 
renden Aktion g € 9 verschaltet. Es existiert also eine Kante (g, u) € Myach; 
die angibt, dass auf u eine gruppierende Aktion g folgt. Ist eine elementa- 
re Aktion v eine (direkte oder indirekte) Subaktion der Aktion g - also Teil 
der Menge Descy,,,(g) - so ist ein Übergang von u nach v möglich. Aller- 
dings nur, sofern jeder Knoten k4, der zwischen u und v liegt, nicht erst nach 
dem Ausführen einer beliebigen anderen Aktion k, aus der Knotenmenge K 
des FHIR-Plans gestartet werden kann. Die Wahrscheinlichkeit von u nach v 
überzugehen, ist dabei gegeben aus dem Produkt der Wahrscheinlichkeit u zu 
verlassen, sowie der Wahrscheinlichkeit in v überzugehen. 


Der fünfte Fall ist ähnlich zum vierten Fall, allerdings liegt nun u im Inne- 
ren eines selektiven oder iterativen Verschaltungsblocks, auf den schließlich 
v folgt. Auch hier gibt es im FHIR-Plan keine direkte Kante von u nach v. 
Stattdessen gibt es eine gruppierende Aktion g, auf die die Aktion v folgt. 
Die Aktion u ist dabei eine (direkte oder indirekte) Subaktion der Aktion g - 
also auch hier wieder Teil der Menge Descy;, „(g). Ein Übergang von u nach 
v ist nur möglich, sofern jeder Knoten ky, der zwischen u und v liegt, keine 
Nachfolgeaktionen k; hat, die nach seinem Beenden noch ausgeführt werden 


müssen. 


Schließlich wird in Fall fünf, sechs und sieben noch der Spezialfall der stillen 
Aktionen abgedeckt: Auf eine elementare Aktion u folgt - direkt oder über 
Umwege - zunächst eine stille Aktion T und erst dann die elementare Akti- 
on v. In Fall fünf sind u, T und v direkt sequentiell verschaltet und t wird 
übersprungen. 


In Fall sechs sind u und T über Umwege verschaltet, d.h. t liegt in einem 
auf u folgenden selektiven oder iterativen Verschaltungsblock. In diesem Fall 
gibt es eine zwischengeschaltete gruppierende Aktion g4. Die Stille Aktion 
T ist eine (direkte oder indirekte) Subaktion der Aktion g4. Sie ist also Teil 
der Nachfahren von g) und gleichzeitig per Definition Teil der Menge aller 
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stillen Aktionen J,. Weiterhin darf - vgl. Fall vier - keine Aktion k, zwischen 
gı und T existieren, die erst nach dem Ausführen einer beliebigen anderen 
Aktion k, gestartet werden kann. Es gilt nun, keinen Übergang von der Aktion 
u in eine stille Aktion T zu erlauben und diese zu überspringen. Dazu muss 
ein Nachfolgeknoten v von gı gefunden werden, welcher sequentiell mit dem 
Elternknoten g, der stillen Aktion T verschaltet ist. 


Fall sieben ist ähnlich zu Fall sechs, allerdings liegt u nun im Inneren eines 
selektiven oder iterativen Verschaltungsblockes, auf den schließlich eine stille 
Aktion t folgt. Demnach gibt es im FHIR-Plan keine direkte Kante von u nach 
T. Stattdessen existiert eine gruppierende Aktion g, und die stille Aktion T 
ist eine direkte oder indirekte Subaktion von gı. Weiterhin darf - vgl. Fall 
fünf - keine Aktion k, zwischen g, und r liegen, die Nachfolgeaktionen k, 
hat, die nach dem Beenden von kz noch ausgeführt werden müssen. Es gilt 
nun wieder, keinen Übergang von u in die stille Aktion 7 zu erlauben und 
diese zu überspringen. Dazu muss ein Nachfolgeknoten g, von u gefunden 
werden, welcher Elternknoten von T ist und gleichzeitig direkte oder indirekte 
Subaktion von g4. 


In allen anderen Fallen ist kein Ubergang von u nach v méglich und die Uber- 
gangswahrscheinlichkeit wird auf Null gesetzt. 


Die Datenoutputs des FHIR-Plans bezeichnen die Merkmale, deren Merkmals- 
werte wahrend der Operation tiber die Zeit beobachtet werden. Einige der 
Datenoutputs 0 € Oou sind mit verschiedenen Aktionen verbunden, reprä- 
sentieren aber dasselbe Merkmal, d. h. sie haben denselben Namen. Sei Oname 
die Menge der eindeutigen Namen der Datenoutputs, die im FHIR-Plan vor- 
handen sind. Die surjektive Funktion Ayam : © > Oyame gebe den Namen 
eines Datenoutputs o zurück. Weiterhin sei eine zweite, bijektive Funktion 
hyum : Oname > 0, ...„n — 1}, mitn = |Oyame| gegeben. Diese Funktion hyum 
ordnet jedem Element von Oxame lexikographisch eine eindeutige natürliche 
Zahl zu. 
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Um die zugrunde liegende CPD für jedes Merkmal zu spezifizieren, definiere 
eine Matrix B* für jedes Element Oyame E Name: 


J! B* V OName € Oname {k= Anum(OName)- 
Die Koeffizienten bk j+1 Jeder Matrix BK seien dabei gegeben durch: 
Je oe ee : 
k. = P(X, = |X, = D, falls j =1 
mer 1 — P(X, = XS =i), sonst, 


wobei j € Val(X;,) = {0,1} und i € Vax‘) = {hy(v) | v € J} wie zuvor 
definiert. 


Die bedingten Wahrscheinlichkeiten P(X ; =j IX, = i) werden aus den Da- 
tenoutputs abgeleitet. Jedem Datenoutput o € Oow ist ein Wahrscheinlich- 
keitswert o.prob zugeordnet und es gilt: 


o.prob, falls 3(a,0) E Mout 


mit 
t t . ae J, oE Oow 
PX, = 1X, =)= _ 
(hyum S. hnam)(0) = k, 
hy(a) =i 
9, sonst. 


Hierbei gebe o.prob die Wahrscheinlichkeit für das Auftreten von o beim 
Ausführen der Aktion a an. Diese Wahrscheinlichkeit ist im Attribut 
probObs.value des Datenoutputs gespeichert. 


Auf diese Weise kann ein FHIR-Plan einer chirurgischen Intervention in ein 
DBN übersetzt werden, wobei die Parameter von 7 als Startverteilung, die 
Parameter von A für Zustandsübergänge und die Matrizen BK für die Wahr- 
scheinlichkeitsverteilungen der Beobachtungen herangezogen werden. 
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5.5 Vorstudie 


Zur praktischen Bewertung des in Kapitel 5.3 dargestellten Standes der Tech- 
nik wurde das Anwendungsbeispiel einer vereinfachten, nachgestellten Ver- 
sorgung mit einer Hüft-TEP (vgl. Kapitell 5.1.1) betrachtet. 


5.5.1 Material und Methoden 


Abbildung 5.19 zeigt eine Momentaufnahme des Experimentallabors aus 
der Vogelperspektive. Die vorgenommenen Vereinfachungen betreffen die 
Anzahl der Akteure und die Detaillierungsgrad der nachgestellten Phasen. 
Der Fokus des nachgestellten Eingriffs liegt damit auf den charakteristi- 
schen Aspekten einer realen Operation (vgl. Kapitel 5.1.1), beispielsweise die 
typische Positionsänderung des Operationsteams. 


Die verwendete Sensorbasis besteht aus vier Kinect V2 Tiefenkameras, welche 
die Distanzwerte über ein Laufzeitverfahren (engl. Time-of-Flight) schätzen 
[Sel14, Fan15]. Aus den verwendeten Algorithmen zur Erfassung der Skelet- 
te der Akteure [Bey16] wird die Positionierung abgeleitet (vgl. œ und A in 
Abbildung 5.19) - weiterhin wird die Anzahl an Personen und die Anzahl der 
verwendeten Instrumente erfasst. Für Letztere wird das ARTTrack2 System 
verwendet [Phil6c, Bey16]. Um die erfassten Daten gebündelt bereitzustellen 
wird die auf dem Robot Operating System (ROS) basierende Forschungsplatt- 
form OP:Sense eingesetzt [Bih16]. 


Der Aufbau liefert 12 verschiedene Lernstichproben Do, ...,D1ı des 7 pha- 
sigen Arbeitsablaufes (vgl. Phasen in Tabelle 5.5). Jede Lernstichprobe D 
besteht aus einer Beobachtungssequenz von Merkmalsvektoren x°'!. Jeder 
Merkmalsvektor x = (X,X1,X,)' is gegeben durch die drei Werte der 
Merkmale Positionierung des Operationsteams, Anzahl Personen am Ope- 
rationstisch und Anzahl benutzter Instrumente. Die typischen Werte jedes 
Merkmals über den 7 Phasen ist in Tabelle 5.5 vereinfachend dargestellt. Die 
tatsächliche Werte der Lernstichproben weichen von dieser idealisierten Dar- 
stellung ab, unter anderem wegen auftretenden Verdeckungen von Personen 
und Gegenständen während der Aufnahmen. 
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Abbildung 5.19: Die Skizze zeigt die im Rahmen der Vorstudie nachgestellte, vereinfachte end- 
prothetische Versorgung eines Patienten mittels einer Hüft-TEP aus der Vogel- 
perspektive. Co bis C3 repräsentieren die Sensorbasis in Form von vier Tief- 
enkameras, welche an der Decke des Experimentallabors befestigt sind. Der 
Instrumentiertisch (IT) wird genutzt um Instrumente abzulegen, die momen- 
tan nicht benötigt werden (gestrichelte Linie). Das Operationsteam besteht aus 
Person Po und Person P4. Diese stehen zu Beginn der Operation in der Nor- 
malposition bezüglich des Operationstisches (OT), also kaudal des Patienten. 
Während des Eingriffs wechseln Po und P4 ihre Positionen zweimal (vgl. ge- 
strichelte Pfeile). Modifiziert nach [Phil6c]. 


Um ein überwachtes Lernen zu ermöglichen, wurden alle Merkmalsvektoren 
während der Erfassung den entsprechenden vorliegenden Phasen zugeord- 
net. Das bedeutet die wahre Klasse w(x) € {a,..., g} ist für alle Elemente in 
Do, ...,D 1, bekannt. Um zur Laufzeit die aktuell vorliegende Phase zu schät- 
zen (vgl. Kapitel 5.2, Konstituenten des Problems) wird ein RF (vgl. Kapitel 
5.3.1) und ein DBN (vgl. Kapitel 5.3.4) eingesetzt. Bei letzterem ist die Struk- 
tur des Netzes so gewählt, dass die Wurzel die aktuell vorliegende Phase re- 
präsentiert. Unter Annahme einer geschlossenen Welt summieren sich diese 
einzelnen Wahrscheinlichkeiten zu 1, da eine der 7 definierten Phasen jeweils 
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Tabelle 5.5: Die Tabelle zeigt in der ersten Spalte die drei verwendeten Merkmale, welche für 
die Klassifikation herangezogen wurden. Die zweite Spalte zeigt die dazugehöri- 
gen Merkmalswerte. Die darauffolgenden Spalten sind mit einem „x“ markiert gdw. 
der Merkmalswert typischerweise in der betreffenden Phase (a-g) beobachtet wird. 
Leicht modifiziert nach [Phil6c]. 


Phasen 

Merkmal Wert a bc de ff g 
Positionierung des kaudal u pe |b 
Operationsteams 

kranial x | x 
Anzahl Personen 1 x ag 
am Operationstisch 

2 x |x ]xi]}x {|x 

0 x | x x x | x 
Anzahl benutzter 
Instrumente 1 x 

2 x 


vorliegen muss. Die Blatter der Struktur des DBNs sind verkniipft mit den ge- 
schatzten bedingten Wahrscheinlichkeiten einen bestimmten Merkmalsvek- 
tor zu beobachten, gegeben eine Phase. Das bedeutet also P(x|E). Zeitliche 
Aspekte werden repräsentiert, indem aufeinanderfolgende Zeitschritte mit- 
einander verknüpft werden (vgl. Kapitel 2.4.5). Übergangswahrscheinlichkei- 
ten geben dabei an, wie wahrscheinlich es ist von einer Phase in eine andere 
Phase überzugehen. 
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Abbildung 5.20: Normalisierte Konfusionsmatrix der Klassifkationsergebnisse des RF. Eine Zei- 
le zeigt die wahre Klassenzugehörigkeit eines Merkmalsvektors, während eine 
Spalte die geschätzte Klassenzugehörigkeit widerspiegelt. Folglich rerpäsentie- 
ren die Diagonalelemente den Anteil der korrekt klassifizierten Merkmalsvek- 
toren. Die Konfusion der Matrix zeigt sich in den falsch klassifizierten Elemen- 
ten abseits der Diagonale, da diese irrtümlich einer anderen (falschen) Klasse 
zugewiesen wurden. Die Abbildung zeigt eine markante Konfusion bei der RF- 
Klassifkation zwischen den Phasen a und g. Auch zeigen sich einige Vorher- 
sagen, die sich weit ab der eigentlich korrekten Phasen bewegen. Überarbeitet 
aus [Sch16]. 


5.5.2 Ergebnisse 


Um die Klassifikatoren zu bewerten wird eine 12-fache Kreuzvalidierung mit 
den Lernstichproben Dp, ..., Dj] vollzogen. Dabei fungiert in den 12 Durch- 
läufen jeweils eine andere Stichprobe als Teststichprobe (vgl. Kapitel 5.2.2). 
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Abbildung 5.21: Normalisierte Konfusionsmatrix der Klassifkationsergebenisse des DBN. Eine 
Zeile zeigt die wahre Klassenzugehörigkeit eines Merkmalsvektors, während 
eine Spalte die geschätzte Klassenzugehörigkeit widerspiegelt. In der Abbil- 
dung zeigt sich deutlich die überwiegend korrekte Vorhersage der Klassen 
durch das DBN-Modell ab, die durch eine Konfusion zwischen benachbarten 
Phasen flankiert wird. Überarbeitet aus [Phil6c]. 


Um das Verhalten der Modelle genauer zu analysieren, werden die gemit- 
telten Resultate in Form von normalisierten Konfusionsmatrizen dargestellt 
(vgl. Abbildungen 5.20 und 5.21). Hierbei repräsentieren die Zeilen die wahre 
Klassenzugehörigkeit w(x) über der geschätzten Klassenzugehörigkeit &(x) 
in den Spalten. Das bedeutet auf den Diagonalelementen der Matrix findet 
sich der Anteil jener Merkmalsvektoren wieder, bei denen die durch den Klas- 
sifikator geschätzte Klassenzugehörigkeit der wahren Klassenzugehörigkeit 
entspricht. Falsch klassifizierte Merkmalsvektoren finden sich somit auf den 
Einträgen abseits der Diagonale. 
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Hier zeigt sich ein interessanter Unterschied bezüglich der verwendeten Mo- 
delle. Während im Falle des RFs sich ähnelnde Phasen oft verwechselt wer- 
den ist bei dem DBN Modell wenig Konfusion zu beobachten (vgl. Einträ- 
ge der Konfusionsmatrizen in den Abbildungen 5.20 und 5.21 der Phasen a 
und g). Dies ist letztlich dadurch zu erklären, dass das DBN Modell das Wis- 
sen nutzt, welches dem Arbeitsablauf der vereinfachten, nachgestellten Hüft- 
TEP zugrunde liegt: Unsinnige Abfolgen von Phasen werden durch niedri- 
ge Übergangswahrscheinlichkeiten verhindert. Die Sequenzmodellierung der 
DBN reduziert also die Konfusion bei phasenabhängigen Merkmalswerten. 


Abbildung 5.20 zeigt weiterhin, dass die Fehlklassifikationen bei dem DBN 
Modell vorwiegend zwischen benachbarten Phasen auftreten, also beim 
Wechsel von einer Phase in die nächste. Ausgelöst wird dies durch die 
Glättung des Klassifikationsergebnisses bei zur Laufzeit wechselnden Beob- 
achtungen. In der Praxis entsteht dadurch ein gewisser zeitlicher Verzug bei 
der Erkennung eines Phasenübergangs. 


Wichtig hierbei ist allerdings, dass dabei nur die bis zum jeweiligen Zeitpunkt 
vorliegenden Merkmalsvektoren herangezogen werden, also online klassifi- 
ziert werden kann (vgl. Kapitel 5.2). Für den gegebenen Anwendungsfall (vgl. 
Kapitel 5.2) sind diese Fehlklassifikationen weniger von Bedeutung als unsin- 
nige, weit vom eigentlichen Fortschritt des Ablaufs entferne Phasen vorher- 
zusagen (vgl. Abbildung 5.20). Dennoch gibt es noch weitere Möglichkeiten 
zur Verbesserung der Ergebnisse. 


5.6 Realstudie 


Mit Hilfe medizinischer Domänenexperten wurde ausgehend von der Vorstu- 
die eine verkürzte reale Hüft-TEP als sogenanntes Phasenexperiment nachge- 
stellt. Zum Einsatz kommt ein OP-Team in Vollbesetzung und ein biomechani- 
sches Patientenphantom. Details finden sich in den folgenden Unterkapiteln 
5.6.1 bis 5.6.2. 
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5.6.1 Material und Methoden 


Die Abbildungen 5.22 und 5.23 zeigt eine Momentaufnahme der Realstudie 
aus der Vogelperspektive. Das Operationsteam der Realstudie besteht aus dem 
Operateur O, dem ersten Assistenten 1A, dem zweiten Assistenten 2A sowie 
dem Instrumenteur I. Damit ist das Operationsteam in Vollbesetzung (vgl. 
Kapitel 5.1.1). 


Abbildung 5.22: Die Abbildung zeigt aus der Vogelperspektive die endoprothetische Versorgung 
mit einer totalen Endorprothese der Hüfte (Hüft-TEP), die im Rahmen der Real- 
studie mit medizinischen Experten und einem Patientenphantom nachgestellt 
wurde (vgl. Kapitel 5.1.1). Co bis C3 repräsentieren dabei die Sensorbasis in 
Form von vier Tiefenkameras, welche an der Decke des Experimentallabors 
angebracht sind. Die instrumentierende Person I reicht Instrumente von In- 
strumentiertisch IT an den Operateur O oder den ersten Assistenten 1A wei- 
ter bzw. nimmt diese wieder entgegen. Letztgenannte stehen zu Beginn der 
Realstudie in der Normalposition bezüglich des Operationstisches (OT), also 
kaudal des auf dem Rücken liegenden biomechanischen Patientenphantoms P. 
Der zweite Assistent 2A steht den Kollegen gegenüber und verrichtet wäh- 
rend der Intervention vor allem Haltearbeit (vgl. Kapitel 5.1.1). In Anlehnung 
an [Phil6c, Sch16]. 
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Abbildung 5.23: Die Skizze zeigt wie Abbildung 5.22 die nachgestellte Hüft-TEP in vereinfachter 
Weise aus der Vogelperspektive. Allerdings befinden sich die Personen O und 
1A in gedrehter Positionierung. D. h. Operateur O steht kranial des Patienten- 
phantoms um den Schaft des Beines mit dem Hammer bearbeiten zu können. 


Das verwendete biomechanische Patientenphantom P bildet die knöchernen 
Strukturen als auch die funktionellen, weichteiligen Strukturen im Bereich 
des rechten Beines und der rechten Hüfte ab. Dies ermöglicht eine vollstän- 
dige und realitätsnahe Abarbeitung der betrachteten Operationsphasen von 
Pfannen- bis zur Schaftpräparation (vgl. Kapitel 5.1.1). 


Die verwendete Sensorbasis besteht aus vier Kinect V2 Tiefenkameras, wel- 
che die Distanzwerte über ein Laufzeitverfahren (engl. Time-of-Flight) schät- 
zen [Sel14, Fan15]. Um die erfassten Daten gebündelt bereitzustellen wird die 
auf dem ROS basierende Forschungsplattform OP:Sense eingesetzt [Bih16]. 
Aus den verwendeten Algorithmen zur Schatzung der Skelette der Akteure 
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OO 


Abbildung 5.24: Die Abbildung zeigt skizzenhaft die chirurgischen Instrumente Hammer (links) 
und Elektrokauter (rechts). Der Hammer wird üblicherweise in Kombination 
mit medizinischen Meißeln und Raspeln eingesetzt. Erstere sind Metalldorne 
wie aus dem Handwerksbereich bekannt. Letztere sind Feilen ähnlich, die al- 
lerdings keinen Handgriff, sondern wie ein Meißel, ein Schlagende aufweisen. 
Der Elektrokauter wird üblicherweise zum Schneiden von Gewebe eingesetzt. 


wird deren Positionierung abgeleitet [Bey16]. Weiterhin wird die Verwen- 
dung des chirurgischen Instruments Hammer und Elektrokauter’ erfasst. Ab- 
bildung 5.24 zeigt skizzenhaft die chirurgischen Instrumente Hammer und 
Elektrokauter. 


Gemeinsam mit den medizinischen Experten wurde der Ablauf der Phasen 
der endoprothetischen Versorgung mittels dem direkten, lateralen, transglu- 
tealen Zugang nach Bauer modelliert (vgl. Kapitel 5.1.1). Dabei wurden so- 
wohl mögliche als auch unmögliche Abfolgen von Phasen, die Dauern der 


1 Hinweis: Wird teils auch als Diathermie bezeichnet. Ein Elektrokauter nutzt elektrischen Strom 
um Gewebe zu zerstören bzw. zu schneiden (siehe Elektrokoagulation). Durch die starke Hit- 
zeeinwirkung können verletzte Gefäße direkt schneidend verschlossen werden, sodass starke 
Blutungen vermieden werden. 
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Tabelle 5.6: Die Tabelle zeigt in der ersten Spalte die drei verwendeten Merkmale, welche für 
die Klassifikation herangezogen wurden. Die zweite Spalte zeigt die dazugehörigen 
möglichen Merkmalswerte. 


Merkmal Wert 
Positionierung des kaudal 
Operationsteams az 
Verwendung des nein 
Hammers : 

ja 
Verwendung des nein 
Elektrokauters f 

ja 


Phasen und das verwendete Instrumentarium sowie dessen Einsatz spezifi- 
ziert. Abbildung 5.25 zeigt den relevanten Ausschnitt aus dem Model mit den 
vier Phasen Pfannenpräparation, Pfannenimplantation, Übergang zur Schaft- 
präparation und der Schaftpräparation. Im Vergleich zu einem vollständigen 
Eingriff (vgl. Kapitel 5.1.1) ist u. a. die Freipräparation des Zugangsweges, die 
Durchtrennung des Schenkelhalses als auch die Entfernung des Hüftkopfes 
vernachlässigt worden. Ebenso fallen die Phasen weg, die bis zur Drainage, 
Wundverschluss und Anlegen eines Verbandes führen. 


Insgesamt konnten so die vier charakteristischen Phasen der insgesamt 14 
Phasen umfassenden Operation in der Realstudie betrachtet werden. Dabei 
wurden vier verschiedene Lernstichproben Do, ... ,D3 erfasst. Jede der Lern- 
stichproben D besteht aus einer Beobachtungssequenz von Merkmalsvekto- 
ren x°'!. Jeder Merkmalsvektor x = (xo, X1, X2)! ist gegeben durch die drei 
Werte der Merkmale Positionierung des Operationsteams, Verwendung des 
Hammers und Verwendung des Elektrokauters (vgl. Tabelle 5.6). 


Zur Augmentierung der Beobachtungssequenzen wurde Bootstrapping ein- 
gesetzt. Bootstrapping ist eine erstmals in [Efr79] vorgestellte Methode zum 
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Hüft-TEP (Ausschnitt) 


im} Hammer [0,97] 
EB > Kauter [0,94] 
EB Pos. [0,95] 


Pfannen- 
präparation 


Hammer [0,83] 
Kauter [0,96] 
Pos. [0,95] 


Pfannen- 
implantation 


Hammer [0,97] 
Kauter [0,97] 
Pos. [0,12] 


Übergang zur 
Schaftpräparation 


Hammer [0,71] 
Kauter [0,92] 
Pos. [0,05] 


Schaft- 
präparation 


Abbildung 5.25: Die Abbildung zeigt den sequentiellen Ablauf der Realstudie anhand der OP- 
Phasen fünf bis acht. Diese Phasen beschreiben einen Ausschnitt aus der ge- 
samten OP, welche in Kapitel 5.1.1 ausführlich erläutert wurde. Das Gesamt- 
modell wurde mit medizinischen Experten entwickelt, welche (un-Jmögliche 
Reihenfolgen der Phasen, die Phasendauern und das verwendete Instrumen- 
tarium sowie diessen Einsatz spezifizierten. Die drei Punkte (---) wurden der 
Abbildung zur Erhöhung der Verständlichkeit hinzugefügt und sollen den 
Ausschnitt-Charakter der vier Phasen betonen. Die Punkte sind nicht Teil der 
UML-Spezifikation [OMG17]. 
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Originalstichprobe 


Zeit- 
schritt 


Zeit- 
Generierte Stichprobe schritt 


Abbildung 5.26: Die Abbildung zeigt das Vorgehen beim Block Bootstrapping nach [Car86]. Die 
ursprüngliche Zeitreihe wird hierzu in einem ersten Schritt in Blöcke mit fester 
Länge unterteilt. Im Beispiel entstehen mit einer Blocklänge von l = 3 insge- 
samt 4 Blöcke. In einem zweiten Schritt wird anschließend aus der Menge der 
generierten Blöcke vier mal zufällig mit Zurücklegen gezogen. Die so gezoge- 
nen Blöcke werden in der Reihenfolge ihres Ziehens zu einer neuen Zeitreihe 
kombiniert, die die gleiche Länge wie die Originalzeitreihe besitzt. 


Resampling, bei der aus einer gegebenen Stichprobe wiederholt Unterstich- 
proben durch zufälliges Ziehen mit Zurücklegen generiert werden. Klassi- 
scherweise besteht die Originalstichprobe dabei aus einzelnen, voneinander 
unabhängigen Beobachtungen. 


Im hier betrachteten Fall bestehen die vorliegenden Stichproben Dg, ... ,D3 
der Realstudie jeweils aus einer Beobachtungssequenz von Merkmalsvektoren 
x°:! Weiterhin liegt für diese Sequenzen die Klassenzugehörigkeiten y°'! vor. 
welche durch die medizinischen Domänenexperten zugeordneten OP-Phasen 
entsprechen. Insgesamt handelt es sich also um vier multivariate Zeitreihen. 


Zur Anwendung auf Zeitreihen muss das in [Efr79] vorgestellte Bootstrap- 
Verfahren allerdings angepasst werden, da nicht davon ausgegangen werden 
kann, dass die einzelnen Merkmalsvektoren x! miti € {0,1,...,t} vonein- 
ander unabhängige Beobachtungen darstellen. Vielmehr können innerhalb 
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Originalstichprobe 


Zeit- 
schritt 


Zeit- 
Generierte Stichprobe schritt 


Abbildung 5.27: Die Abbildung zeigt das Vorgehen beim Moving Block Bootstrapping nach 
[Kun89]. Auch hier wird die ursprüngliche Zeitreihe in Blöcke fester Länge 
unterteilt, die sich nun allerdings überlappen dürfen. Im Beispiel entstehen mit 
einer Blocklänge von l = 3 insgesamt 10 Blöcke. Aus der Menge dieser 10 
Blöcke wird anschließend vier mal zufällig mit Zurücklegen gezogen. und die 
gezogenen Blöcke in der Reihenfolge ihres Ziehens zu einer neuen Zeitreihe 
kombiniert. 


der Zeitreihe zeitliche Abhängigkeiten auftreten - so kann beispielsweise die 
Ausprägung eines Merkmalsvektors x! von seinen Vorgängern {x!~!, x!~?, ...} 
abhängig sein. Um solche zeitlichen Abhängigkeiten innerhalb von Zeitreihen 
bewahren zu können, wurde in [Car86] eine angepasste Variante des Boot- 
strappings, das sogenannte Block Bootstrapping, vorgestellt. 


Hierbei wird die vorliegende Zeitreihe x°'! in einem ersten Schritt zunächst in 
Blöcke der Länge l, fx OAL gl:2l=1, g2l:3l-1,, x=l:t} unterteilt. Anschlie- 
Bend werden in einem zweiten Schritt statt einzelner Beobachtungen x!,i € 


{0, 1, ... , t} ganze Blöcke konsekutiver Beobachtungen mit Zurücklegen gezo- 
gen und zu einer neuen Zeitreihe kombiniert. Abbildung 5.26 verdeutlicht das 
Vorgehen anhand einer beispielhaften Blocklänge von | = 3. 


Durch dieses Vorgehen können zwar die innerhalb der einzelnen Blöcke be- 
stehenden zeitlichen Abhängigkeiten bewahrt werden, jedoch gehen zeitliche 
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Abhängigkeiten, die über die Blocklänge | hinaus bestehen, verloren. Ent- 
scheidend ist also die Wahl einer für die Stichprobe optimalen Blocklänge I. 
Diese hängt sowohl von der Länge der vorliegenden Zeitreihe, als auch von 
deren Autokorrelationsfunktion ab, vgl. [Pol04]. Im hier vorgestellten Ansatz 
wird die optimale Blocklange nach dem in [Pol04] und [Pat09] publizierten 
Algorithmus mithilfe der Toolbox ARCH [She19] bestimmt. 


Weiterhin wurden in der Literatur verschiedene Varianten des Block Boot- 
strappings vorgeschlagen, vgl. [Büh02]. Beispielsweise werden bei dem in Ab- 
bildung 5.27 dargestellten Moving Block Bootstrap Verfahren nach [Kun89] 
zusätzlich sich überlappende Blöcke der Länge l berücksichtigt. Jedoch sind 
hierdurch in den entstehenden Bootstrap-Stichproben die Merkmalsvektoren, 
die sich am Anfang und Ende der Originalzeitreihe befanden, systematisch 
unterrepräsentiert. 


Dies versucht man beim Circular Block Bootstrapping nach [Pol91] zu um- 
gehen, indem man die Originalzeitreihe vor dem Resampling wiederholt an- 
einander reiht und auch hier sich überlappende Blöcke zulässt (vgl. Abbil- 
dung 5.28). Weiterhin kann Circular Bootstrapping sowohl für reellwertige, 
als auch für kategoriale Zeitreihen angewendet werden [Büh02]. Das Verfah- 
ren des Circular Bootstrappings wird daher im Folgenden für die Erweiterung 
der Datenbasis eingesetzt. 


Bei den vorliegenden Zeitreihen der Realstudie handelt es sich um Instanziie- 
rungen konkreter Merkmalswerte über die Zeit, die dazu herangezogen wer- 
den, die OP-Phase über die Zeit zu klassifizieren, vgl. Kapitel 5.2. Damit eine 
solche Klassifikation funktioniert, ist zu erwarten, dass sich der Erwartungs- 
wert und die Varianz der Merkmale über die einzelnen OP-Phasen ändern, 
bzw. bei nominalen Merkmalswerten, wie beispielsweise der Positionierung, 
ist denkbar, dass eine Ausprägung eine bestimmte OP-Phase dominiert, sich 
dies in der nächsten OP-Phase jedoch ändert. 


Zum Augmentieren der Datenbasis wird daher Circular Bootstrapping nicht 
über alle Phasen einer Aufnahme hinweg durchgeführt, sondern die jeweilige 
Aufnahme vorab in ihre einzelnen Phasen unterteilt und das Bootstrapping je 
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Phase separat durchgeführt (vgl. Abbildung 5.29). Hierfür wird für jede Phase 
individuell eine optimale Blocklänge bestimmt. 


—— Hammer 
—— Kauter 
Phase 0 Phase 1 Phase 2 Phase 3 
0 5000 10000 15000 20000 25000 Zeit- 


Schritt 


Abbildung 5.29: Beispielhafte Zeitreihe mit Instanziierungen der Merkmalswerte fiir die Merk- 
male Hammer und Elektrokauter fiir die vier OP-Phasen der Realstudie. Fiir die 
Augmentierung der Datenbasis werden die Zeitreihen zunachst in die einzel- 
nen OP-Phasen unterteilt. Fiir jede der Phasen werden separat optimale Block- 
längen bestimmt und Circular Block Bootstrapping durchgeführt. Die so ge- 
nerierten Bootstrap-Stichproben der Einzelphasen werden anschließend nach 
Phasennummer sortiert und zu Gesamtzeitreihen eines Arbeitsablaufs kombi- 
niert. 


Abbildung 5.30 zeigt beispielhaft für eine Originalstichprobe die mittels Circu- 
lar Block Bootstrapping generierten zusätzlichen Abläufe anhand der Merk- 
male Hammer und Elektrokauter. 


5.6.2 Ergebnisse 


Mit den insgesamt 100 Stichproben Dj, ...,Dg9 wurde eine 4-fach Kreuzvali- 
dierung durchgeführt (vgl. Kapitel 5.2.2). In den 4 Durchläufen fungiert jeweils 
ein anderes Bündel von 25 Stichproben als Testmenge (vgl. Abbildung 5.31). 
Dabei wird ein RF, ein DBN sowie ein Expertenbasiertes DBN (EBN) mitein- 
ander verglichen. Für die Festlegung der Modellparameter des RFs wurde zu- 
sätzlich eine 3-fach Kreuzvalidierung eingebettet und mittels Gridsearch die 
Anzahl der Bäume, Gütekriterium für eine Teilung, Anzahl berücksichtigter 
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Abbildung 5.30: Beispielhafte durch Circular Block Bootstrapping generierte Zeitreihen fiir die 
Originalstichprobe aus Abbildung 5.29. Generierte Zeitreihen fiir das Merkmal 


Hammer (links) und das Merkmal Elektrokauter (rechts). 
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Komponenten des Merkmalsvektors bei Teilung sowie dem Abbruchkriterium 
über die Mindestanzahl der Merkmalsvektoren pro Blatt variiert (vgl. Kapitel 
5.3.1). Das EBN wurde um das Expertenwissen ergänzt, welches die Dauern 
der Phasen, die Festlegung der Reihenfolge der Phasen und Verwendung von 
Instrumenten sowie deren Einsatz betrifft. D.h. das EBN ist im Hinblick auf 
P(X o) und P(X : xX T modifiziert; unmögliche Übergänge sind beispielswei- 
se mit einer Übergangswahrscheinlichkeit von 0 gesetzt. Für diese Kompo- 
nente der Wissensakquisition (vgl. Kapitel 2.2) wurde das UML Aktivitätsdia- 
gramm aus Abbildung 5.25 auf Seite 173 eingesetzt. 


Beer | os | oe | Ds | 
=r A) Sl I 
Do Dis IF | Dso | | Drs H 
E | « — | ppp — | en 
Dò H Drs |r | Do fb | Dis [F 
=] = S SI 
o |F [os H | os IF | 
Abbildung 5.31: Die Abbildung zeigt die Aufteilung der insgesamt 100 Lernstichproben 
Dp, --- Dg. Es werden vier Durchläufe durchgeführt (siehe vier Zeilen). In 


jedem Durchlauf fungiert ein Paket von jeweils 25 Beobachtungssequenzen als 
Testmenge (grau). Jedes der Pakete wurde aus einer der originalen Beobach- 
tungssequenzen Do, ... , D3 gewonnen. 


In den Tabellen 5.7 bis 5.10 finden sich die Auswertungen der betrachteten 
Modelle. In den ersten Zeilen sind RF, DBN und EBN mit den entsprechenden 
Kennwerten sowie empirischer Standardabweichung aufgelistet (vgl. Kapitel 
5.2.2). Dabei wird den Modellen sukzessive pro Zeitschritt ein weiterer Merk- 
malsvektor zur Verfügung gestellt - die Beobachtungssequenz baut sich also 
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Tabelle 5.7: Die Tabelle zeigt in der ersten Spalte die betrachteten Klassifikatormodelle und in 
den folgenden vier Spalten die Kennwerte zur Bewertung der Problemlösung (vgl. 
Kapitel 5.2.2) und deren empirische Standardabweichung (+x %). Bezüglich der 
Precision zeigt sich eine schwache Leistung des RF. Weiterhin ist die Leistung des 
EBN in allen Durchläufen signifikant besser als das rein datenbasiert trainierte DBN. 
Ersteres ist sehr nah an der bestmöglichen Klassifikation für den gegebenen Anwen- 


dungsfall. 


Precision der einzelnen Durchläufe der Kreuzvalidierung 


Modell 0 1 2 3 
RF 74,2% 70,0% 74,1% 68,1% 
+0,57 % +0,73% +0,55 % +0,78% 
DBN 81,8% 79,1% 85,3% 80,9% 
+1,6% +2,5% +1,88% +2,0% 
EBN 95,5% 94,4% 97,6% 95,4% 
+3,9% +3,6% +1,9% +3,4% 
Viterbi 96,6% 96,1% 98,2% 97,1% 
+3,0% +2,8 % +1,9% +2,7 % 


über die Zeitschritte hinweg auf und das Modell hat keinen Einblick in zu- 
künftige Merkmalsvektoren (vgl. Kapitel 5.2). Als Referenz ist die best mögli- 
che Klassifkationsbewertung angegeben, die erreicht werden kann, wenn die 
gesamte Beobachtungssequenz a-prior bekannt ist und der wahrscheinlichste 


Pfad durchlaufen wird (Viterbi). 


In Tabelle 5.7 findet sich die Precision über den einzelnen Durchläufen der 
Kreuzvalidierung. Neben der schwachen Leistung des RF stellt sich das EBN 
in allen Durchläufen als signifikant besser als das DBN dar. 


Betrachtet man den Recall in Tabelle 5.8, so ergibt sich ein ähnliches Bild. 
Auch hier ist Leistung des RF schwach, während das EBN in allen Durchläu- 
fen signifkant besser als das DBN ist. Eine Ausnahme stellt allerdings der letz- 
te Durchlauf der Kreuzvalidierung dar; Hier kann das EBN keine signifikant 
bessere Leistung bezüglich des Recalls erbringen. 
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Tabelle 5.8: 


Die Tabelle zeigt die betrachteten Klassifikatormodelle und die Kennwerte zur Be- 
wertung der Problemlösung mitsamt deren empirischer Standardabweichung. Der 
RF zeigt durchweg eine signifikant schwächere Leistung als die Vergleichsmodelle. 
Weiterhin ist die Leistung des EBN in drei von vier Durchläufen signifikant besser 
als das rein datenbasiert trainierte DBN. 


Recall der einzelnen Durchläufe der Kreuzvalidierung 


Modell 0 1 2 3 

RF 58,2% 54,9% 60,9% 64,1% 
+1,7% +2,6 % +1,7% +1,7% 

DBN 83,6 % 81,8% 90,1% 93,3% 
+3,3% +4,6% + 2,6 % +3,0% 

EBN 96,3% 96,0% 98,0% 97,2% 
+3,2% +3,2% +1,6% +2,5% 

Viterbi 96,7 % 97,1 % 98,4 % 98,0 % 
+3,1% +2,5% +1,8% +2,4% 

Tabelle 5.9: Die Tabelle zeigt in der ersten Spalte die betrachteten Klassifikatormodelle. In den 


folgenden vier Spalten sind die Kennwerte zur Bewertung der Problemlösung auf- 
gelistet. Darüber hinaus sind jeweils die empirischen Standardabweichungen ange- 
geben. Bezüglich des Jaccard-Score (Jaccard) zeigt sich eine schwache Leistung des 
RF. Weiterhin ist die Leistung des EBN in allen Durchläufen signifikant besser als 
das rein datenbasiert trainierte DBN. 


Jaccard der einzelnen Durchläufe der Kreuzvalidierung 


Modell 0 1 2 3 
RF 34,4% 30,7% 36,3% 33,6 % 
+1,7% +1,8% +2,0% +2,0% 
DBN 66,8 % 65,8 % 76,1% 74,4 % 
+4,4% +6,0% +3,9% +4,8% 
EBN 91,9% 90,6 % 95,6 % 92,7 % 
+6,7% +6,0% +3,1% +5,0% 
Viterbi 93,4% 93,4% 96,7% 95,1% 
+5,7% +4,5% +3,4% +4,3% 


182 


5.6 Realstudie 


95,7 97,0 87.2 96,9 97,6 
0,92 > 0,92 +0,77 
100% - TE re 453 0220, 
+2,6 
80% -| 
60% -| 
40% - 
20% - 
0%- 
Precision Recall Jaccard-Score 
BEE RF BEE DBN EBN Viterbi 


Abbildung 5.32: Die Abbildung zeigt die Gesamtergebnisse der Kreuzvalidierung bezüglich 
Precision, Recall und Jaccard-Score - also den Kennwerten zur Bewertung der 
Problemlösung (vgl. Kapitel 5.2.2). Darüber hinaus sind jeweils die empiri- 
schen Standardabweichungen angegeben. Dabei zeigt sich der RF als signifi- 
kant schlechter als die Vergleichsmodelle. Ebenso zeigt das DBN signifikant 
schlechtere Ergebnisse als das EBN. 


Tabelle 5.10: Die Tabelle zeigt in den Spalten die Gesamtergebnisse der Kreuzvalidierung bezüg- 
lich Precision, Recall und Jaccard-Score (Jaccard). Weiterhin sind jeweils die empi- 
rischen Standardabweichungen angegeben. Hinweis: Eine alternative Darstellung 
der Ergebnisse findet sich in Abbildung 5.32. 


Modell Precision Recall Jaccard 
RF 71,6% 59,5% 33,7% 
+3,1% +3,9% + 2,3 % 
DBN 81,8% 87,2% 70,8% 
+2,6% +5,3% +5,1% 
EBN 95,7 % 96,9 % 92,7 % 
+1,3% +0,92% +2,1% 
Viterbi 97,0 % 97,6 % 94,6 % 
+0,91% +0,77% +1,6% 
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Abbildung 5.33: Normalisierte Konfusionsmatrix der Klassifikationsergebnisse des DBN. Eine 
Zeile zeigt die wahre Klassenzugehörigkeit eines Merkmalsvektors, während 
eine Spalte die geschätzte Klassenzugehörigkeit widerspiegelt. In der Abbil- 
dung zeichnet sich die optimale Klassifikation mit Werten auf der Winkelhal- 
bierenden ab - es herrscht allerdings eine gewissen Konfusion zwischen be- 
nachbarten und weiter entfernten Phasen. 


Tabelle 5.9 zeigt den Jaccard-Score* über den Durchläufen der Kreuzvalidie- 
rung. Zum wiederholten Male zeichnet sich die signifikant bessere Leistung 
des EBNs ab. 


Das Gesamtergebnis der Kreuzvalidierung ist schließlich in Abbildung 5.32 
und in Tabelle 5.10 aufgetragen. Dabei liefert der RF durchweg signifikant 
schlechtere Ergebnisse als die Vergleichsmodelle. Es zeigt sich weiterhin, dass 


* Hinweis: Erklärungen und Definitionen zur Bewertung der Problemlösung finden sich in Ka- 
pitel 5.2.2 ab Seite 117. 
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Abbildung 5.34: Normalisierte Konfusionsmatrix der Klassifikationsergebnisse des EBN. Eine 
Zeile zeigt die wahre Klassenzugehörigkeit eines Merkmalsvektors, während 
eine Spalte die geschätzte Klassenzugehörigkeit widerspiegelt. In der Abbil- 
dung zeigt sich deutlich die überwiegend korrekte Vorhersage der Klassen 
durch das DBN-Modell ab, die durch eine gewisse Konfusion zwischen benach- 
barten Phasen flankiert wird. 


das EBN bezüglich der gewählten Kennwerte der Leistungsbewertung durch- 
weg signifikant besser ist als das DBN. Darüber hinaus sind die Kennwerte 
des EBN nahe der best möglichen Klassifikationsbewertung unter Kenntnis 
der gesamten Beobachtungssequenz (Viterbi). 


Genauere Einblicke bezüglich der klassenspezifischen Leistungen liefern die 
Abbildungen 5.33 und 5.34. Diese zeigen die Konfusionsmatrizen für eine ex- 
emplarische Beobachtungssequenz der Testmenge. 
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Es ist zu erkennen, dass das EBN durch das Ausschließen unsinniger Über- 
gänge eine stärkere Ausprägungen auf der Winkelhalbierenden zeigt als das 
DBN. Weiterhin zeigt sich beim EBN eine bessere Abgrenzung der Phasen auf 
den ungesehenen Merkmalsvektoren der Testmenge. 


5.7 Galle 


Zur praktischen Bewertung des in Kapitel 4 vorgestellten Verfahrens zur Wis- 
sensakquisition und Problemlösung wird im Folgenden die laparoskopische 
Cholezystektomie betrachtet. Hierbei handelt es sich um einen prototy- 
pischen Vertreter minimalinvasiver Interventionen mit vergleichsweise 
häufigen Fallzahlen (vgl. Kapitel 5.1.2). 


5.7.1 Material und Methoden 


Die laparoskopische Cholezystektomie wird über vier künstliche Körperöff- 
nungen durchgeführt. Durch diese Körperöffnungen wird dann das Instru- 
mentarium eingeführt, welches genutzt wird, um letztlich die Gallenblase* zu 
ektomieren. Bei dem oben genannten Verfahren kommt weiterhin ein Lapa- 
roskop? zum Einsatz. Abbildung 5.35 zeigt den Interventionsraum aus der Vo- 
gelperspektive. 


Für den betrachteten Anwendungsfall liegen 57 vollständige Stichproben sol- 
cher Cholezystektomien vor, die von 13 verschiedenen Chirurgen während 
realer chirurgischer Intervention an Patienten durchgeführt und mittels ei- 
nes Laparoskops aufgezeichnet wurden [Twi17]. Unvollständige Stichproben 
wurden entfernt - die verworfenen Aufnahmen enthalten teils obligatorische 
Phasen nicht, da die Aufnahme beispielsweise zu spät gestartet wurde oder 
während der Aufnahme die Aufzeichnung unterbrochen wurde. 


* Hinweis: Engl. Cholecyst. Weitere Details siehe Kapitel 5.1.2. 
2? Hinweis: Ein spezielles Endoskop, welches für die Durchführung einer Laparoskopie, also einer 
Bauchspiegelung, verwendet wird. 
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CO 


Abbildung 5.35: Die Abbildung zeigt eine vereinfachte Momentaufnahme des Operationssaa- 
les bei der Durchführung der laparoskopischen Cholezystektomie. Der Patient 
P liegt rücklinks auf dem Operationstisch. Operateur O, erster Assistent 1A, 
zweiter Assistent 2A und der Instrumentierende I stehen um den Tisch herum. 
Der Instrumentierende I reicht die Instrumente (vgl. Tabelle 5.11) von Instru- 
mentiertisch IT weiter. Die Instrumente werden über künstliche Körperöff- 
nungen in den Patienten P eingeführt. Als Bildgebung fungiert ein Laparoskop. 


Jede der vollständigen Stichproben D besteht aus einer Beobachtungs- 
sequenz von Merkmalsvektoren x?! wobei jeder Merkmalsvektor x = 
(Xo; X1, X2, X3, X4, Xs, X6)! gegeben ist durch die sieben Merkmale die in 
Tabelle 5.11 gelistet sind. Es handelt sich dabei um das für den Eingriff 
notwendige Instrumentarium. 


Weiterhin ist für jeden Merkmalsvektor dessen Klassenzugehörigkeit w(x) € 
{0, ..., 6} über medizinische Experten bekannt. Die Datensätze sollen im Fol- 
genden zur Darstellung der in Kapitel 4 ausgearbeiteten Vorgehensweise ver- 
wendet werden. 
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Tabelle 5.11: Die Tabelle zeigt in der ersten Spalte die sieben verwendeten Merkmale, welche 
für die Klassifikation der sieben Phasen herangezogen wurden. Die zweite Spalte 
zeigt die möglichen Merkmalswerte. 


Merkmal Wert 
Verwendung der nein 
F 
asszange ” 
Verwendung des nein 
Elektrokauters : 
ja 
Verwendung der nein 
Prä ti 
räparationszange A 
Verwendung der nein 
Schere 
ja 
Verwendung des nein 
Cli likat 
ipapplikators is 
Verwendung der nein 
Spül 
pülung r 
Verwendung des nein 
Bergebeutels f 
ja 


188 


5.7 Galle 


Die chirurgische Intervention der Cholezystektomie kann in sieben Phasen 
eingeteilt werden. Im Einzelnen sind diese Phasen gemäß den verwendeten 
Stichproben gegeben als: 


0. Präparation vorbereiten 

1. Calot’sches Dreieck freipräparieren 

2. Gefäße clippen und schneiden 

3. Gallenblase freipräparieren 

4. Gallenblase in Bergebeutel verbringen 
5. Leberbett säubern und koagulieren 


6. Bergebeutel herausführen 


Zwischen den Phasen bestehen Abhängigkeiten - diese lassen sich anschau- 
lich mittels eines Graphen formalisieren. 


Abbildung 5.36 zeigt eine UML-Aktivität als Wissenserwerbskomponente 
über den zugrunde liegenden Ablauf des betrachteten Anwendungsfalls. 
Hierbei wurden sowohl mögliche als auch unmögliche Abfolgen von Phasen, 
die Dauern der Phasen und das verwendete Instrumentarium sowie dessen 
Einsatz spezifiziert. 


5.7.2 Ergebnisse 


Die Leistungsbewertung des Klassifikationsproblems bezogen auf die einzel- 
nen Phasen ist den Tabellen 5.12, 5.13 und 5.14 zu entnehmen. In den Zeilen 
der Tabellen sind die verwendeten Modelle RF, DBN sowie EBN aufgeführt. 
Als Referenz ist die best mögliche Klassifikationsbewertung angegeben, die 
erreicht werden kann, wenn die gesamte Beobachtungssequenz a-prior be- 
kannt ist und der wahrscheinlichste Pfad durchlaufen wird (Viterbi). 
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/Cholezystektomie o N 
Präparation 
vorbereiten 


Fasszange [0,50] 


p 


m~ 
Calot'sches Dreieck 
freipräparieren 


Fasszange [0,64] 
Präparationszange [0,83] 
Elektrokauter [0,01] 


n 
Fasszange [0,55] 
Elektrokauter [0,04] 
Präparationszange [0,04] 
Schere [0,19] 
Clipapplikator [0,37] 
Spülung [0,02 


Gefäße clippen 
und schneiden 


Fasszange [0,45] 
Elektrokauter [0,01] 

Präparationszange [0,77] 
Schere [0,01] 
Clipapplikator [0,01] 
Spülung [0,01 


Gallenblase 
freipräparieren 


a 


>) 


Gallenblase in 
Bergebeutel verbringen 


er 
Sa 
Fasszange [0,50] 
Elektrokauter [0,31] 


Leberbett säubern Präparationszange [0,03] 
und koagulieren Clipapplikator [0,01] 

Spülung [0,42] 

Bergebeutel [0,32] 


Bergebeutel [0,74] 
Fasszange [0,79] 


Fasszange [0,31] 
Bergebeutel Elektrokauter [0,05] 
herausführen Spülung [0,04] 
Bergebeutel [0,19] 


Abbildung 5.36: UML Aktivität des betrachteten Anwendungsfalls der Cholezystektomie. 
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Tabelle 5.12: Die Tabelle zeigt in der ersten Spalte die verwendeten Modelle, welche für die Klas- 
sifikation herangezogen wurden. Die weiteren Spalten zeigen die Bewertung der 
Problemlösung auf die einzelnen Phasen heruntergebrochen. Dabei sind die darge- 
stellten Kennwerte das arithmetische Mittel aller Durchläufe der Kreuzvalidierung. 


Precision über den Phasen 


Modell 0 1 2 3 4 5 6 
RF 18,3% 64,7% 94,2% 56,2% 713% 581% 17,7% 


+1,5% +0,45% +0,85% +1,1% +2,2% +5,1% +0,89% 


DBN 95,4% 97,3% 54,4% 61,8% 45,5% 53,7% 24,2% 
+0,95% +2,5% +5,2% +0,89% +2,1% +4,3% +0,73% 


EBN 97,8% 98,4% 70,3% 64,0% 60,9% 52,7% 30,5% 
+0,24% +1,3% +3,6% +0,54% +3,1% +4,4% +2,0% 


Viterbi 98,6% 98,5% 72,6% 98,1% 734% 90,5% 783% 
+2,6% +1,8% +2,1% +1,8% +3,2% +2,1% +2,6% 


Durch das Expertenwissen ergibt sich in einzelnen Phasen eine Verbesserung 
der Klassifikationsleistung. Tabelle 5.12 zeigt den Sachverhalt für die Precis- 
ion. In den Phasen 0, 2, 3, 4 und 6 ist das EBN signifikant besser als das rein 
datenbasiert eingelernte DBN. Umgekehrt zeichnet sich in den Phasen 1 und 
5 keine Verbesserung bezüglich der Precision ab. 


In Tabelle 5.13 findet sich ein ähnliches Ergebnis für den Recall. Überwiegend 
ist das EBN signifikant besser als das DBN, lediglich in den Phasen 4, 5 und 
6 ergeben sich Abweichungen. Schließlich zeigt der Jaccard-Score in Tabelle 
5.14 dass das EBN in allen Phasen signifikant besser ist, ausgenommen der 
Phase 5 - hier bleibt die Leistung bezüglich des DBNs aber erhalten. 


Genauere Einblicke geben die Konfusionsmatrizen in den Abbildungen 5.37 
und 5.38. Die Matrizen sind bezüglich ihrer Zeilen (wahren Klassen) norma- 
lisiert, d.h. die Einträge der Zeilen ergeben sich zu 100 %. 
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Tabelle 5.13: Die Tabelle zeigt in der ersten Spalte die verwendeten Modelle, welche für die Klas- 
sifikation herangezogen wurden. Die weiteren Spalten zeigen die Bewertung der 
Problemlösung auf die einzelnen Phasen heruntergebrochen. Dabei sind die darge- 
stellten Kennwerte das arithmetische Mittel aller Durchläufe der Kreuzvalidierung. 


Recall über den Phasen 


Modell 0 1 2 3 4 5 6 
RF 52,3% 516% 65,9% 43,2% 75,6% 539% 56,4% 
+2,1% +0,93% 42,2% +0,78% +1,4% +70% +1,6% 
DBN 73,9% 42,5% 476% 835% 50,9% 584% 870% 
+5,9% +1,5% +2,1% +1,1% +1,8% +9,6% +3,6% 
EBN 95,7% 46,4% 76,6% 86,2% 53,4% 60,2% 83,8% 
+1,8% +0,33%+41,5% +0,74% 41,7% +84% +5,2% 
Viterbi 97,1% 914% 94,5% 91,9% 92,8% 787% 88,0% 


Tabelle 5.14: 


+0,85% +1,5% +1,8% +12% +2,1% +1,9% +1,9% 


Die Tabelle zeigt in der ersten Spalte die verwendeten Modelle, welche für die Klas- 
sifikation herangezogen wurden. Die weiteren Spalten zeigen die Bewertung der 
Problemlösung auf die einzelnen Phasen heruntergebrochen. Dabei sind die darge- 
stellten Kennwerte das arithmetische Mittel aller Durchläufe der Kreuzvalidierung. 


Jaccard-Score über den Phasen 


Modell 0 1 2 3 4 5 6 

RF 14,2% 40,1% 62,7% 31,77% 57,6% 39,6% 15,4% 
+1,4% +0,84% +2,6% +0,55% +0,77% +5,2% +0,73% 

DBN 71,7% 42,5% 36,0% 541% 32,6% 411% 23,6% 
+5,7% +1,5% +1,6% +1,2% +1,1% +52% +10% 

EBN 93,6% 46,3% 59,1% 570% 41,77% 415% 29,5% 
+2,1% +0,35% +2,4% +0,72% +0,77% 44,6% +2,4% 

Viterbi 93,8% 911% 72,6% 91,6% 712% 73,1% 73,5% 
+3,3% +1,5% +2,1% +1,3% +3,2% +2,0% +1,3% 
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100 % 


13% 95% 0,7% 00% 0,7% 


0,3% 3,6% ann 1,2% 73% 80 % 
0,0% on 8,7% 28% 3,3% 
0,0% 1,6% 2,8% 5,2% 


60 % 


40 % 


0,0% 0,0% 3,2% on 1,0% 
0,0% 0,0% 0,0% 7,1% 25,4% [20% 


0,0% 0,0% 0,0% 26% 65% RUKA 


-0% 


Abbildung 5.37: Normalisierte Konfusionsmatrix der Klassifkationsergebenisse des DBN. Eine 
Zeile zeigt die wahre Klassenzugehörigkeit eines Merkmalsvektors, während 
eine Spalte die geschätzte Klassenzugehörigkeit widerspiegelt. 


Vergleicht man in beiden Matrizen die Spalten 1 und 5, so fallen ähnliche 
Verhältnisse zwischen korrekter Klassifikation und einem Verschmieren von 
Fehlklassifikationen im jeweils restlichen Teil der Spalte ab. 


Für die Phase 1, bedeutet das beispielsweise, dass beide Modelle bei etwa 1% 
der Merkmalsvektoren der Phase 0 eine falsche (zu frühe) Einordnung zu Pha- 
se 1 vorgenommen wurde (vgl. Matrizen in der Zeile 0 und Spalte 1 mit Werten 
1,3 % bzw. 1,1%). 


Gleichzeitig werden in beiden Modellen knapp 0,2 % der Merkmalsvektoren 
der Phase 2 irrtümlich (noch) als Phase 1 klassifiziert (vgl. Matrizen in der 
Zeile 2 und Spalte 1 mit Werten 0,2 % bzw. 0,3 %). 
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100 % 
6,0% 0,0% 00% 0,6% 
3,8% 382% 0,2% 7,4% 80 % 
164% 0,1% 5,6% 
60% 
B 0,7% 5,0% 
S 
40% 
1,0% 
a 20% 
22% 6,5% 
0% 


Abbildung 5.38: Normalisierte Konfusionsmatrix der Klassifkationsergebenisse des EBN. Eine 
Zeile zeigt die wahre Klassenzugehörigkeit eines Merkmalsvektors, während 
eine Spalte die geschätzte Klassenzugehörigkeit widerspiegelt. 


Auch in den Zeilen 4, 5 und 6 beider Matrizen zeigen sich ähnliche Einträge. 
Schwächen beider Modelle liegen in der Konfusion der Merkmalsvektoren der 
Phase 4 mit der letzten Phase 6. 


In den restlichen Bereichen der Matrizen ergeben sich teils deutliche Unter- 
schiede. Das EBN zeigt dort weniger Konfusion an den Rändern (also weit 
entfernten Phasen) und zeigt stärkere Ausprägungen auf den Diagonalele- 
menten. Die Phase 2 ist in diesem Zusammenhang besonders hervorzuheben. 


In der Gesamtschau ergeben sich die Ergebnisse in Tabelle 5.15 und Abbildung 
5.39 auf Seite 195. Dabei zeigt sich das EBN in Summe für alle Kennwerte 
signifikant besser als DBN und RF. 
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Tabelle 5.15: 


Die Tabelle zeigt in den Spalten die Gesamtergebnisse der Kreuzvalidierung bezüg- 
lich Precision, Recall und Jaccard-Score (Jaccard). Weiterhin sind jeweils die empi- 
rischen Standardabweichungen angegeben. Hinweis: Eine alternative Darstellung 
der Ergebnisse findet sich in Abbildung 5.39. 


Modell Precision Recall Jaccard 
RF 54,4% 57,0% 51,8% 
+1,0% +1,3% +1,1% 
DBN 61,8 % 63,4% 60,5 % 
+ 0,72 % +1,1% +0,7 % 
EBN 67,8% 71,8% 66,9% 
+ 0,43 % + 0,27 % + 0,43 % 
Viterbi 87,1% 90,6 % 92,4% 
+1,1% +1,0% +1,2% 
90,6 92,4 
100% - +1,0 +1,2 
71,3 7 j 
80% - 63,4 +0,27 
5 fe +1,1 pee 
60% - ; 
40% 
20% - 
0%- 
Precision Recall Jaccard-Score 
BEE RF BEE DBN EBN Viterbi 


Abbildung 5.39: Die Abbildung zeigt die Gesamtergebnisse der Kreuzvalidierung bezüglich 
Precision, Recall und Jaccard-Score - also den Kennwerten zur Bewertung der 
Problemlösung (vgl. Kapitel 5.2.2). Darüber hinaus sind jeweils die empiri- 
schen Standardabweichungen angegeben. Dabei zeigt sich der RF als signifi- 
kant schlechter als die Vergleichsmodelle. Ebenso zeigt das DBN signifikant 
schlechtere Ergebnisse als das EBN. 
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Die Beiträge der vorliegenden Dissertation zur Formalisierung und Analy- 
se von medizinischen Prozessen lassen sich thematisch in den Bereichen der 
Unterstützung bei Diagnosestellung, sowie der Assistenz bei chirurgischen 
Interventionen verorten. Es ist abzusehen, dass zukünftig in diesen Bereichen 
viele Aspekte der klinischen Praxis und des Gesundheitswesens durch KI ent- 
scheidend mitgeprägt werden [Yu18]. 


Datenbasierte KI-Methoden, insbesondere Verfahren aus dem Bereich des Ma- 
schinellen Lernens, brillieren üblicherweise, wenn große und strukturierte 
Datenmengen verfügbar sind. Anhand großer Lern-, Validierungs- und Test- 
stichproben können so zum Beispiel im Kontext der bildgebenden Diagnostik 
unterschiedlich parametrisierte Modelle eingelernt und beurteilt werden. 


Betrachtet man jedoch allgemein den Bereich der Diagnostik, stehen geeigne- 
te Stichproben häufig nur eingeschränkt und/oder in unstrukturierter Form 
zur Verfügung. Deshalb werden Verfahren zur Strukturierung und zum Her- 
stellen von Interoperabilität immer wichtiger. 


In diesem Zuge gewann FHIR zunehmend an Bedeutung [Leh19a, Hub20]. 
Ziel von FHIR ist es, medizinische Daten weltweit auszutauschen, zu sam- 
meln und mit Methoden der KI nutzen zu können [Leh19b]. Medizinische 
Daten können so auffindbar (engl. Findable), zugänglich (engl. Accessable), 
interoperabel (engl. Interoperable) sowie wiederverwendbar (engl. Reusable) 
genutzt werden - also sprich: nach dem sogenannten FAIR-Prinzip [Wil16, 
Thu21]. 
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Abgeleitet aus den beschriebenen Entwicklungen, nutzte die vorliegende Dis- 
sertation FHIR zur Wissensrepräsentation im Rahmen der Prozessmodellie- 
rungen. Weiterhin wurde gezeigt, wie gezielt vorhandenes Expertenwissen 
genutzt, um auch in Bereichen, die datenarm aber wissensreich sind, perfor- 
mante probabilistische Abgleichmodelle bereitstellen zu können. Im medizi- 
nischen Kontext sind hier speziell die Bereiche der Diagnosestellung oder der 
chirurgischen Interventionen zu nennen. Es zeigt sich, dass mithilfe der vor- 
gestellten Ansätze implizit vorhandenes Prozesswissen formalisiert und eine 
praxistaugliche Assistenz konzipiert und bereitgestellt werden kann. 


6.1 Fazit 


In dieser Arbeit wurden zunächst die Grundlagen der wissensbasierten Mo- 
dellierung beleuchtet. Dabei wurde auf Expertensysteme und deren Verbin- 
dung zur KI eingegangen. Im weiteren Verlauf sind Bayes-Netze und FHIR 
ausführlich vorgestellt worden. Letztere wurden hinsichtlich einer Wissens- 
repräsentation in Zusammenhang mit einer medizinischen Entscheidungsun- 
terstützung betrachtet. Dabei wurde ein erster Beitrag dieser Arbeit, die pro- 
babilistische Erweiterung eines FHIR DataRequirements, erläutert. 


Schließlich wurde im Detail auf die Prozessmodellierung eingegangen, hierin 
wurden allgemeine Definition, Petri-Netze, UML-Aktivitätsdiagramme sowie 
Prozessbäume näher beleuchtet. Damit wurde der Grundstein zum Verständ- 
nis der nachfolgenden Kapitel der Arbeit gelegt. 


Im weiteren Verlauf wurde auf den zweiten Beitrag, die Transformation zwi- 
schen Prozessbäumen und FHIR, eingegangen. Dabei konnte gezeigt werden, 
dass die dargelegte Transformation sowohl für die Hin- als auch für die Rück- 
transformation strukturerhaltend ist. Darüber hinaus bettet sich die vorge- 
stellte Transformation in ein entworfenes Gesamtkonzept (dritter Beitrag) ein, 
in welchem sie als entscheidendes Puzzlestück für die Überführung von so- 
wohl Expertenwissen als auch von Ergebnissen datenbasierter Methoden zur 
Entdeckung von Abläufen dient. 
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Ausgehend von diesen Ergebnissen wurden zwei prototypische Vertreter chir- 
urgischer Interventionen vorgestellt: die endoprothetische Versorgung eines 
Patienten mittels einer totalen Endoprothese der Hüfte, sowie die laparosko- 
pische Cholezystektomie, ein chirurgisches Verfahren zur Entfernung (Ekto- 
mie) der Gallenblase (engl. Cholecyst). Ausgehend vom Stand der Technik 
zur medizinischen Phasendetektion wurde die entwickelte Transformation 
eines FHIR-Plans in ein expertenbasiertes DBN vorgestellt (vierter Beitrag). 
Das Modell wurde in einer Vor- und Realstudie sowie an einem öffentlichen 
Datensatz einer Leistungsbewertung unterzogen. Dabei stellte sich das exper- 
tenbasierte DBN mit solider Leistung unter Berücksichtigung der gewählten 
Leistungswerte, Precision, Recall und Jaccard-Score heraus. 


6.2 Ausblick 


Die in dieser Arbeit vorgestellte Transformation zur medizinischen Phasende- 
tektion kann in Anlehnung an die bereits getätigten eigenen Veröffentlichun- 
gen erweitert werden, vgl. [Phil5a, Phi15b, Phil5c, Phil6a, Phil6b, Phil6c, 
Sch16, Phi17a, Phi17b, Phi17c, Phil8a, Phil8b, Phil8c, Phil8e, Phi18d, Phi19a, 
Phi19b, Phi19c, Phi20, Bom21b, Phi21, Bom21a, Phi22]. Interessant ist dies vor 
allem im Bereich der Diagnose, die nicht nur einen einzigen, isolierten Medi- 
ziner betrifft, sondern ein Zusammenspiel mehrerer Disziplinen beinhaltet. 


Durch die steigende Komplexitat in der medizinischen Diagnostik und The- 
rapie sind künftig immer mehr Szenarien denkbar, in denen Medizinerinnen 
und Mediziner verschiedener Disziplinen gemeinsam an einem klinischen Fall 
arbeiten. Allerdings nicht mehr isoliert voneinander mit Synchronisationen 
nur in längeren Abständen, sondern mit der Möglichkeit, jederzeit bei der ei- 
genen Arbeit auf die gegenwärtig vorhandenen Patientendaten, sowie auf die 
Ergebnisse der Kollegen und eines Entscheidungsunterstützungsystems zuzu- 
greifen. So könnte beispielsweise ein Radiologe vor dem Verfassen seines Be- 
richtes bereits auf die Ergebnisse und die abgeleitete Handlungsempfehlung 
der nur Stunden zuvor erstellten Gewebeauswertung der betreffenden Patien- 
tin zugreifen und so seine Tätigkeiten sofort in die richtige Richtung lenken. 
In der derzeit herrschenden Arbeitsweise erfahren Ärztinnen und Ärzte in der 
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Regel erst im Nachhinein, z.B. im Rahmen eines wöchentlichen Tumorboards, 
von aktuellen Entwicklungen. Durch die beschriebenen neuen, kooperativen 
Ansätze ist zu erwarten, dass die Diagnose- und Therapiequalität verbessert 
und die zeitlichen Abläufe stark verkürzt werden können. 


Derlei Ansätze sind für Praxisnetzwerke, ländliche Praxen, aber auch für gro- 
ße Klinikverbünde von großem Interesse, wie die Konsortien der eigenen Pro- 
jekte und Projektanträge zeigen. Hier können die vorgestellten Beiträge wich- 
tige Grundpfeiler sein, auf deren Erweiterungen maßgeschneiderte, multidis- 
ziplinäre Assistenzfunktionen bereitgestellt werden können. 


Zusätzlich ergeben sich in der medizinischen Praxis bei der Formalisierung 
der Daten neue Herausforderungen. Betrachtet man das Beispiel der Patho- 
logie, so werden hier aktuell im Rahmen von FHIR (und daran angeschlossen 
auch SNOMED CT) neue, noch nicht vorhandene Datenstrukturen geschaf- 
fen, um den in dieser Disziplin eigenen Prozessen und Artefakten gerecht 
zu werden. Während dieser Bestrebungen entstehen durch den technischen 
Fortschritt in diesem medizinischen Bereich fortwährend neue Ideen für zu- 
sätzliche Strukturen. Beispielsweise erzielt die sektorenweise, automatische 
Auswertung von Tumorgewebe deutlich genauere Ergebnisse als dies bislang 
durch die Kennzeichnung des Gewebes als insgesamt tumorös üblich war. 
Durch den erhöhten Detaillierungsgrad erfordert diese Technik jedoch auch 
neue Strukturen zur Formalisierung. Dies führt in den entsprechenden Gre- 
mien unweigerlich zur Bewertung des zusätzlichen Aufwands im Vergleich 
zum Nutzen: „Welche Vorteile bringt die Erfassung und Formalisierung dem 
Medizinischen Fachpersonal?“ Also sprich: „Wo bleibt die Verknüpfung mit 
Entscheidungsunterstützungssystemen und wie hoch ist der Benefit (Quick- 
win oder langfristige Vorteile) von derlei Aktivitäten?“ 


Um diese dringenden Fragen zu adressieren, bedarf es abseits der Hinterle- 
gung bloßer (Untersuchungs-)Werte auch einer Formalisierung und Hinter- 
legung des medizinischen Prozesswissens, das die einzelnen Untersuchungs- 
schritte zu einem Gesamtablauf verbindet. Dieses Wissen existiert zwar im- 
plizit in den Köpfen der beteiligten Disziplinen, die Prozesse sind aber typi- 
scherweise nicht formal hinterlegt, prüfbar, austauschbar und vor allem nicht 
direkt verknüpfbar. 
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6.2 Ausblick 


Auch hier können die in dieser Arbeit getätigten Beiträge (und deren Erwei- 
terung) helfen und durch die Formalisierung, Hinterlegung und Verknüpfung 
von Expertenwissen zu medizinischen Prozessen neue Impulse setzen, wie 
auch das Engagement auf Konferenzen, der DIN und SNOMED International 
zeigen. 


Weiterhin müssen Entscheidungen immer noch von menschlichen Experten 
getroffen werden, auch wenn sie von KI-basierten Systemen unterstützt wer- 
den. Der effiziente und effektive Einsatz solcher Assistenzsysteme setzt vor- 
aus, dass Domänenexperten verstehen, wie eine KI-Lösung zu einer Empfeh- 
lung, z.B. einer bestimmten Therapie, kommt. Mit zunehmender Schwere der 
Entscheidungen (z.B. im Rahmen der Diagnose und Therapie onkologischer 
Erkrankungen) kann das Vertrauen in KI-Systeme schnell sinken. Besonders 
vielversprechend ist jedoch gerade der Einsatz von Methoden der Klin der 
Krebsbehandlung, da Tumorerkrankungen in Zukunft in vielen Fällen nicht 
mehr nach ihrer Lokalisation, sondern nach ihrem genomischen Profil behan- 
delt werden. Diagnostische und therapeutische Entscheidungen werden also 
zu einem großen Teil auf der molekulargenetischen Tumoranalyse von Pa- 
tienten beruhen, die durch KI ideal unterstützt werden kann. Hierzu ist es 
allerdings notwendig, Faktoren der Akzeptierbarkeit* zu betrachten, die für 
Entscheidungsträger (z.B. Ärzte, Patienten, ...) bei genomisch-onkologischen 
Diagnose- und Therapieentscheidungen besonders relevant sind. KI-basierte 
Fehlentscheidungen im medizinischen Kontext liegen in einem besonders sen- 
siblen Bereich: Beispielsweise kann eine von einem KI-System empfohlene 
Röntgenuntersuchung bei einer schwangeren Frau entgegen medizinischer 
Prozesse geltender Leitlinien stehen. Im Sinne der Kontrollierbarkeit können 
medizinische Prozesse, welche mit der in dieser Arbeit vorgestellten Vorge- 
hensweise formalisiert wurden, als Leitplanken für KI-Algorithmen dienen 
und deren Ergebnismenge einschränken. 


* Hinweis: Akzeptanz (Acceptance) entsteht beim Menschen selbst. Um sie günstig zu beeinflus- 
sen, sollte nach technischen Ansätzen mit einem hohen Grad der Akzeptierbarkeit (Accepta- 
bility) gestrebt werden. Möglichkeiten dies technisch umzusetzen, bestehen beispielsweise in 
den Bereichen der Erklärbarkeit, Transparenz, Fairness und Kontrollierbarkeit. 
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Abkürzungen 


AI 


ANSI 


BN 


BPM 


BPMN 


CAS 


CNN 


CPD 


CPT 


DAG 


Artificial Intelligence | S. 13, 14 
American National Standards Institute | S. 34 
Bayes-Netz | S. 25, 30, 31 


Geschäftsprozessmodellierung (engl. Business Process Mode- 
ling) | S. 51 


Geschäftsprozessmodell und -notation (engl. Business Pro- 
cess Model and Notation) | S. 52, 82, 83 


Computerassistierte Chirurgie (engl. Computer Assisted Sur- 
gery) | S. 101 


Faltendes Neuronales Netz (engl. Convolutional Neural Net- 
work) | S. 149 


Conditional Probability Distribution - bedingte Wahrschein- 
lichkeitsverteilung | S. 26 


Conditional Probability Table - bedingte Wahrscheinlich- 
keitstabelle | S. 26 


gerichteter (engl. directed) azyklischer Graph | S. 25-28, 30, 
74 
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Abkürzungen 


DBN 


DIN 


EBN 


ePA 


EPK 


FHIR 


GOFAI 


HL7 


HMM 


ISO 


KI 


KNN 


LOINC 


LSTM 


MIO 
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Dynamisches Bayes-Netz | S. ii, 31-33, 143-145, 147, 149, 150, 
152-156, 164, 165, 167, 168, 178, 180, 181, 183-185, 189, 191, 
193-195, 199 

Deutsches Institut für Normung e.V. | S. 201 


Expertenbasiertes DBN | S. 178, 180, 181, 183-186, 189, 191, 
194, 195 


Elektronische Patientenakte | S. i, 2, 3, 35, 37 
Ereignisgesteuerte Prozesskette | S. 52, 82 


Fast Healthcare Interoperability Resources | S. i, ii, 2-5, 34-39, 
69, 73, 81-83, 88-90, 92, 150, 197-200 


Good Old-Fashioned Artificial Intelligence | S. 14 

Health Level Seven | S. 34 

Hidden Markov Modell | S. 115, 142, 143, 147, 149, 154 
International Organization for Standardization | S. 34 
Künstliche Intelligenz | S. 1-3, 7, 11, 13-16, 35, 197, 198, 201 
Künstliche Neuronale Netze | S. 149, 150 

Logical Observation Identifiers Names and Codes | S. 38, 43 


Langes Kurzzeitgedachtnis (engl. Long Short-Term Memory) 
|S. 149 


Medizinisches Informationsobjekt | S. 3, 37 


Abkürzungen 


OMG 


OSI 


RF 


RNN 


ROS 


SMART 


SNOMED 


SPN 


TBN 


TEP 


UML 


WBS 


Object Management Group | S. 63 
Open Systems Interconnection | S. 34 


Random Forest | S. 132-137, 142, 146, 147, 164, 166, 168, 178, 
180-184, 189, 194, 195 


Rekurrentes Neuronales Netz | S. 149 
Robot Operating System | S. 163, 170 


Substitutable Medical Applications Reusable Technologies | S. 
35 


Systematized Nomenclature of Medicine | S. 38, 43, 200, 201 
Stochastisches Petri-Netz | S. 139-141, 147 
Temporal Bayesian Network | S. 32 


Totale Endoprothese | S. 103-105, 107, 108, 113, 114, 135, 163, 
164, 168-170, 208 


Unified Modeling Language | S. 63, 73, 82, 83, 114, 173 


Wissensbasiertes System | S. 7-9, 81 
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Medizinischer Glossar 


Calot’sches 
Dreieck 


Chole- 
zystektomie 


Elektro- 
kauter 


Elektro- 
koagulation 
Kaudal 
Kranial 


Laparoskop 


Bereich zwischen Leber, Gallenwege und Arterien. Dient als 
Orientierungshilfe bei der Cholezystektomie. | S. 110, 111 


Chirurgisches Verfahren zur Entfernung (Ektomie) der Gal- 
lenblase (engl. Cholecyst). Nicht zu verwechseln mit einer 
Cholezystostomie, also dem Offnen (Stomie) der Gallenblase. 
| S. 108-112, 134, 143, 149, 186, 187, 189, 199, 207, 208 


Chirurgisches Instrument, welches im Rahmen einer Elektro- 
koagulation eingesetzt werden kann um Gewebe zu durch- 
trennen. | S. 171, 178, 179 

Zerstörung von Gewebe mittels Strom. Wird häufig zur Blut- 
stillung und/oder zur Durchtrennung von Gewebe eingesetzt. 
| S. 111, 171, 207 

Zum Steißbein hin orientiert. | S. 165, 172 

Zum Schädel hin orientiert. | S. 104, 165, 172 

Ein spezielles Endoskop, welches für die Durchführung einer 


Laparoskopie, also einer Bauchspiegelung, verwendet wird. | 
S. 109, 186 
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Medizinischer Glossar 


Pneumo- 
peritoneum 


Totale Endo- 
prothese 


Trokar 


Vierer- 
position 
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Ansammlung von Gasen in der Bauchhöhle. Eine Ansamm- 
lung von Kohlendioxid oder Helium wird beispielsweise bei 
einer Insufflation der Bauchhöhle im Rahmen einer laparo- 
skopischen Cholezystektomie künstlich herbeigeführt. | S. 
109, 110 


Die endoprothetische Versorgung eines Patienten mittels ei- 
ner totalen Endoprothese (siehe TEP), ist ein Eingriff, beidem 
Körperteile vollständig (=total) durch eine Prothese (=künst- 
liches Körperteil) ersetzt werden. Diese Prothese verbleibt im 
Inneren (=endo) des Menschen als sogenannte Endoprothese. 
Häufig werden Hüft- oder Kniegelenke endoprothetisch ver- 
sorgt - man spricht dann von Hüft- bzw. Knie-TEPs. | S. 169, 
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Spitzer Dorn mit umgebender Hülse. Dient zur Schaffung 
künstlicher Körperöffnungen. | S. 43, 44, 110 


Position eines Patienten im Rahmen einer Hüft-TEP. Der Un- 
terschenkel des betroffenen Beines wird dabei im rechten 
Winkel auf dem Oberschenkel des anderen Beines positio- 
niert, sodass der Eindruck einer Vier entsteht. | S. 106, 108 


Symbolverzeichnis 


Allgemein 


Vektoren klein, kursiv, fett 

Matrizen groß, kursiv, fett 

Mengen groß, kalligraphisch 
Zufallsvariablen groß, kursiv, unterstrichen 
Bezeichner groß oder klein, kursiv 


Vektor, Matrix, Zufallsvariable und Bezeichner 
mit Index n 


Vektor, Zufallsvariable und Bezeichner 
zum Zeitschritt t 


Vektor, Zufallsvariable und Bezeichner 
mit Index n zum Zeitschritt t 


Vektoren und Zufallsvariablen gebündelt in einer 
Sequenz Xo, ..- , Xn bzw. Xo: ie Xa von Index 0 bis 
Index n 


Vektoren und Zufallsvariablen gebündelt in einer 
Sequenz x°,..,x' bzw. x, A X von Zeitschritt 
0 bis Zeitschritt t 


Vektor und Matrix transponiert 
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Symbolverzeichnis 


Speziell 
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Leere Menge 
Ereignisse 
Übergangsmatrix 


Eintrag der Matrix A in Zeile mit Index i und Spalte 
mit Index j 


Menge der Aktionen eines Prozesses 
Matrix der Emissionswahrscheinlichkeiten 


Eintrag der Matrix B in Zeile mit Index i und Spalte 
mit Index j 


Menge der Eingabe-Datenobjekte eines Prozessbaums 


Menge der Ausgabe-Datenobjekte eines 
Prozessbaums 


Menge der Entscheidungs- und Verbindungsknoten 
eines UML Aktivitätsdiagramms 


Menge der Entscheidungsknoten eines UML 
Aktivitätsdiagramms 


Menge der Verbindungsknoten eines UML 
Aktivitätsdiagramms 


Konfusionsmatrix 


Eintrag der Konfusionsmatrix C in Zeile mit Index i 
und Spalte mit Index j 


Menge der Gabelungs- und Synchronisationsknoten 
eines UML Aktivitätsdiagramms 


Menge der Gabelungsknoten eines UML 
Aktivitätsdiagramms 


Symbolverzeichnis 


Cyn Menge der Synchronisationsknoten eines UML 
Aktivitatsdiagramms 

Chi(v) Menge der Kindknoten eines Knoten v 

Diem Lernstichprobe 

Drest Teststichprobe 

Dyal Validierungsstichprobe 

Di i-te Stichprobe 

Deg* (v) Ausgangsgrad eines Knotens v 

Deg (v) Eingangsgrad eines Knotens v 

Desc(v) Menge der Nachfahren eines Knoten v 

ESN Elementares Systemnetz 

E Kantenmenge des Graphen eines BN 

Ep. ÊB Kantenmengen des Graphen eines DBN 

F Flussrelation eines Petri-Netzes 

G=(V,E) Graph eines BN mit Knotenmenge V und 
Kantenmenge € 

GL Menge der gruppierenden Aktionen für Sequenzen 
eines FHIR-Plans 

H=(K,M) Graph eines FHIR-Plans mit Knotenmenge K und 
Kantenmenge M 

H Menge möglicher Emissionen eines HMM 

i, j,k,l,m,n Ganzzahlige Indizes 

J Menge des Startknotens eines UML 
Aktivitatsdiagramms 

J Menge der elementaren Aktionen eines FHIR Plans 

ar Menge der stillen Aktionen eines FHIR Plans 

I start Menge der Startaktion eines FHIR Plans 


211 


Symbolverzeichnis 


J Ende 
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Menge der Endaktion eines FHIR Plans 
Knotenmenge eines FHIR Plans 

Menge der Schaltraten 

Schaltrate mit Index i 

Anfangsmarkierung, Markierung mit Index 0 
Markierung 

Kantenmenge eines FHIR Plans 


Menge der Kanten eines FHIR Plans, die Aktionen 
mit einem ihnen zugeordneten Dateninput verbinden 


Menge der Kanten eines FHIR Plans, die eine 
sequentielle Verschaltung von Aktionen 
repräsentieren 


Menge der Kanten eines FHIR Plans, die Aktionen mit 
einem ihnen zugeordneten Datenoutput verbinden 


Menge der Kanten eines FHIR Plans, die 
repräsentieren, dass eine Aktion vor dem Beginn 
einer anderen abgeschlossen sein muss 


Menge der Kanten eins FHIR Plans, die gruppierende 
Aktionen mit ihren Subaktionen verbinden 


Menge der natürlichen Zahlen einschließlich Null 
Knotenmenge eines UML Aktivitätsdiagramms 
Netzstruktur 


Menge der Objektknoten eines UML 
Aktivitätsdiagramms 


Menge der Dateninputs eines FHIR Plans 
Menge der Datenoutputs eines FHIR Plans 


Klasse oder Ergebnis 


Symbolverzeichnis 


Wahre Klassenzugehörigkeit 
des Merkmalsvektors x, oder auch: Label 


Geschätzte Klassenzugehörigkeit des 
Merkmalsvektors x, oder auch: Klassifikation 


Klassen- oder Ergebnisraum 

Menge der Plätze 

Wahrscheinlichkeit 
Verbundwahrscheinlichkeit 

Bedingte Wahrscheinlichkeit 

Menge der Elternknoten eines Knoten v 

Platz 

Vektor der Startverteilung 

Menge der Transitionen 

Transition 

Vorbereich der Transition q 

Nachbereich der Transition q 

Kantenmenge eines UML Aktivitätsdiagramms 
Datenfluss eines UML Aktivitätsdiagramms 
Kontrollfluss eines UML Aktivitätsdiagramms 
Reihenfolge der Kindknoten des Knotens u 
Menge verborgener Zustände eines HMM 
Zeitschritt 


Graph eines Prozessbaums mit Knotenmenge X und 
Kantenmenge Y 


Stille Aktion eines Prozessbaumes 


Menge der stillen Aktionen eines Prozessbaumes 
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Symbolverzeichnis 


U=(N,R) 


Vv 

VB VB. 
Val (X) 

| Val(X)| 


nun. 
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Graph eines UML Aktivitätsdiagramms mit 
Knotenmenge N und Kantenmenge R 


Knotenmenge des Graphen eines BN 
Knotenmengen des Graphen eines DBN 
Wertebereich einer Zufallsvariable X 


Anzahl der Werte des Wertebereichs einer 
Zufallsvariablen X 


Weg innerhalb des gerichteten Graphen G vom 
Knoten u bis zum Knoten v gegeben als Folge von 
Knoten 


Knotenmenge auf dem Weg vom Knoten u zum 
Knoten v innerhalb des gerichteten Graphen G ohne 
den Anfangsknoten u 


Merkmalsvektor 
Knotenmenge eines Prozessbaums 
Kantenmenge eines Prozessbaums 


Menge des Endeknotens eines UML 
Aktivitätsdiagramms 


Menge möglicher Operatortypen eines 
Prozessbaumes 


Menge der Operatorknoten eines Prozessbaumes 


Nebenläufiger Verschaltungsoperator eines 
Prozessbaumes 


Selektiver Verschaltungsoperator eines 
Prozessbaumes 


Sequentieller Verschaltungsoperator eines 
Prozessbaumes 


Schleifen-Operator eines Prozessbaumes 
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